育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

混合线性模型如何检测固定因子和随机因子的显著性以及计算R2

已有 9661 次阅读 2019-5-11 19:46 |个人分类:农学统计|系统分类:科研笔记| lme4, 混合线性模型, 显著性, LRT

很多朋友写信问我, 像要知道固定因子的显著性和随机因子的显著性如何计算,他们使用的是lme4这个R包, 但是这个包使用anova时没有P值,还要手动计算, 随机因子也需要自己计算loglikehood值, 然后使用LRT的卡方检验进行显著性检验, 其实lme4包有扩展的包可以非常友好的做这件事情.

1. 载入数据和软件包

###载入软件包和数据
library(lme4)
library(lmerTest)
library(sjstats)
library(learnasreml)
data(fm)

2. 软件包介绍

lme4

  • R语言中最流行的混合线性包

  • 结果不太友好, 所以才有下面两个包作为辅助

  • 安装方法

    install.packages("lme4")

lmerTest

  • 主要是用于检测lme4对象的固定因子和随机因子,它有两个函数:

  • lmerTest::anova.lmerModLmerTest用于检测固定因子的显著性, 方差分析表采用III平方和的形式.

  • lmerTest::ranova用于检测随机因子的显著性, 使用的是LRT检验, 给出的是卡方结果.

  • 安装方法

    install.packages("lmerTest")

sjstats

  • 可以计算R2

  • 可以提取方差组分

  • 安装方法

install.packages("lmerTest")

3. 使用lme4进行混合线性分析

模型介绍

  • 固定因子: Spacing + Rep

  • 随机因子: Fam

建模

### 固定因子: Spacing+Rep, 随机因子: Fam

fm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)

固定因子检验

anova(fm1) # 固定因子显著性检验

image.png

可以看到Spacing 和Rep都达到极显著


随机因子显著性检验

ranova(fm1) # 随机因子显著性检验,LRT

image.png

可以看到Fam达到极显著


计算R2


r2(fm1) # 计算R2
R-Squared for Generalized Linear Mixed Model

Family : gaussian (identity)
Formula: h1 ~ Spacing + Rep + (1 | Fam)

   Marginal R2: 0.116
Conditional R2: 0.277


计算固定因子每个水平的P值


p_value(fm1) # 计算每个水平的显著性

image.png


提取方差组分


re_var(fm1) # 计算方差组分
    image.png

4. 使用asreml进行对照

建模

library(asreml)

fm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm,trace=F)

固定因子检验

anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asreml

image.png

随机因子显著性检验

这里首先构建一个空模型, 然后使用LRT检验

fm_Null = asreml(h1 ~ Spacing + Rep, data=fm,trace=F)
lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRT


image.png

summary(fm2)$varcomp[,1:2] # 方差组分

image.png

还有一个包叫MuMIn,也可以计算R2

5. 关于混合线性模型计算R2

library(MuMIn)

r.squaredLR(fm1)#计算R2

0.217233511687581

6. 完整代码分享

# 混合线性模型, 如何检测固定因子和随机因子

###载入数据
library(lme4)
library(lmerTest)
library(sjstats)
library(learnasreml)
data(fm)
str(fm)

### 固定因子: Spacing+Rep, 随机因子: Fam
fm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)
summary(fm1)

anova(fm1) # 固定因子显著性检验
ranova(fm1) # 随机因子显著性检验,LRT

r2(fm1) # 计算R2

p_value(fm1) # 计算每个水平的显著性

re_var(fm1) # 计算方差组分

### 对比asreml
fm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm)
anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asreml
fm_Null = asreml(h1 ~ Spacing + Rep, data=fm)
lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRT
summary(fm2)$varcomp[,1:2] # 方差组分

library(MuMIn)
r.squaredLR(fm1)#计算R2

如果您对于数据分析,对于软件操作,对于数据整理,对于结果理解,有任何问题,欢迎联系我。

邮箱: dengfei_2013@163.com

微信公众号:R-breeding





https://blog.sciencenet.cn/blog-2577109-1178435.html

上一篇:科学网好霸气 博客上传48小时不能修改
下一篇:我72岁开始学习python,花了一个星期--参加R语言会议有感
收藏 IP: 47.244.196.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 18:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部