育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

混合线性模型笔记1:模型假定

已有 622 次阅读 2019-8-27 06:46 |个人分类:数量遗传学|系统分类:科研笔记

前言

之前的GS专栏中,我们介绍了基因组选择中的理论,实践代码,数据过滤,模型介绍等。在基因组选择中,BLUP的方法应用范围最广,BLUP是混合线性模型中随机因子的效应值,因此想要了解基因组选择,混合线性模型是基础。

因此下面几篇博文中我们将系统介绍混合线性模型的基本知识,包括模型定义,公式推导,似然函数书写,方差组分估算等内容。并通过使用编程语言(RPythonJulia)实现相关操作。

理论学习和编程语言一起学习,不亦乐乎?

1. 混合模型假定

解释

  • y为观测值向量

  • b为固定因子效应值向量(BLUE)

  • X为固定因子关系矩阵

  • u为随机因子效应值向量(BLUP)

  • Z为随机因子关系矩阵

  • e为残差向量

假定

  • E(u) = 0 # 即BLUP值的平均值为0

  • Var(u) = G # 即BLUP值的方差为G

  • E(e)= 0 # 残差平均值为0

  • Var(e) = R # 残差方差为R

  • Cov(u,e)= 0 # 残差和BLUP相互独立,协方差为0

可以写为:

上面的意思是u和e的平均值为0,方差为G和R,协方差为0

推断

2. 固定,随机和混合模型

2.1 固定模型

所有效应都是固定效应,对应的就是没有随机效应,称为固定模型


2.2 随机模型

所有效应都是随机效应,对应的就是没有固定效应,称为随机模型




2.3 混合模型

既有固定因子,又有随机因子,称为混合模型




3. 向量计算方差公式推导

如果a是向量,y = ax, 如果var(x) = V, 那么var(y) = var(ax) = aVar(x)a' = aVa', 下面是具体描述

假定:


X是随机向量,并且,那么:

4. 混合线性模型为何适合分析动植物育种数据

模型假定优势: 一般线性模型 VS 混合线性模型:

  • 一般线性模型要求数据是独立的,混合线性模型不要求,可以定义随机因子的关系矩阵A, G, H来分析相关数据

  • 一般线性模型要求数据是齐次的,混合线性模型不要求,可以定义不同水平独立残差分布,或者残差关系矩阵

动植物育种数据特点:

  • 个体间有亲缘关系,无论是IBD,还是IBS,可以通过A矩阵,G矩阵,H矩阵定义

  • 不同地点,不同场,不同年,方差分布通常不是齐次的

  • 数据经常有缺失或者数据不平衡

这些特点,使用混合线性模型非常适合分析动植物育种数据。依据混合线性模型的BLUP值进行排名,是最好的,无偏的,最佳预测的值。

5. 参考文献

张勤. 动物遗传育种中的计算方法[M]. 科学出版社, 2007.
吴密霞. 线性混合效应模型引论[M]. 科学出版社, 2013.




http://blog.sciencenet.cn/blog-2577109-1195363.html

上一篇:大量阅读的重要性--读书笔记
下一篇:读文献:全基因组选择模型进展及展望

1 张鹰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-11-14 09:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部