育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

线性混合模型学习笔记2:公式解释

已有 600 次阅读 2020-9-12 10:11 |个人分类:数量遗传学|系统分类:科研笔记| LMM

上一章节中(http://blog.sciencenet.cn/blog-2577109-1195363.html),我们介绍了混合线性模型中的模型假定,这一章节,用一个动物育种的示例,介绍固定因子,随机因子以及相关矩阵的推导,明确什么是G矩阵,什么是R矩阵,以及他们和方差组分的关系。直和和直积也是重要的概念,特别是多个随机因子以及随机因子有互作时,经常用到,这里用R语言编程的形式介绍直和与直积的计算方法。

1. 混合模型公式

「混合线性模型」

image.png

  • G是G矩阵,它是由随机因子方差组分 和关系矩阵A相乘而来,A由系谱构建的亲缘关系矩阵
  • R是R矩阵,它是由残差的方差组分和关系矩阵I相乘而来,I为单位矩阵

「​举个栗子:」

比如这里不同场的一些个公牛(Sire)的体重(y),公牛之间是有亲缘关系的,如果要分析这个数据,公牛作为随机因子,模型为:

image.png

假定:

image.png

那么:

image.png

如果,公牛之间是由亲缘关系A的,那么:

image.png

2. 多个固定因子和多个随机因子的剖分

这里b为固定因子的效应值,加入固定因子有多个,场,年,季,性别等等,那么b 可以分解为:[b1, b2, b3,...]

X为固定因子对应的矩阵,X也可以分解为:[X1,X2,X3...]

同样的道理,随机因子和随机因子的矩阵,也可以剖分为类似的形式,比如动物模型中,除了加性效应,还可以有母体效应,永久环境效应,窝别效应作为随机因子。

3. 直和和直积

3.1 概念解释

直和(Direct sum)和直积(Direct product)是混合线性模型中经常用到的概念,下面用具体例子介绍直积和直和是如何通过R语言计算的。

比如下图中,D为22的矩阵,F为22的矩阵,那么直和就是讲D和F作为对角线,非对角线为0,构成一个44的矩阵。直积D的每个元素分别和F矩阵相乘,得到44的矩阵。

image.png

3.2 R语言实现直和和直积

「函数构建」

这里直积我们用R的默认函数kronecker,为了方便操作,我们赋予它另一个名称:direct_product。 对于直和,我们构建了一个函数,可以将两个矩阵变成直和的结果。

direct_sum<- function(mat1,mat2){
  r1 <- dim(mat1)[1];c1<- dim(mat1)[2]
  r2 <- dim(mat2)[1];c2<- dim(mat2)[2]
  rbind(cbind(mat1,matrix(0,r1,c2)),cbind(matrix(0,r2,c1),mat2))
}
direct_product <- kronecker
image.png

4. sigma参数化和gamma参数化

一般混合模型中的假定都是sigma参数化的:

这样随机效应的方差组分为sigma_g^2, 残差的方差组分为sigma_e^2.但是也有另一种表示方法,即gamma参数化。

一般,我们假定:

image.png

image.png

这样做的好处是方便指定初始值,只需要指定比例(比如根据遗传力推导)即可,很方便,这样,y的方差就变成了:

image.png

5. 参考文献

张勤. 动物遗传育种中的计算方法[M]. 科学出版社, 2007. 吴密霞. 线性混合效应模型引论[M]. 科学出版社, 2013.




http://blog.sciencenet.cn/blog-2577109-1250243.html

上一篇:冷风骑车与贝多芬的命运交响曲
下一篇:R语音读取txt报错:UTF-16不支持 或者<ff><fe><63>\'多字节字符串有错

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-10-29 05:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部