育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

一步法中混合线性模型方程组构建和控制--blupf90

已有 2121 次阅读 2019-4-12 18:54 |个人分类:数量遗传学|系统分类:科研笔记

参考文献

http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf

image

1,ABLUP VS SSGBLUP

传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵

image

传统的动物模型计算BLUP值

根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)

image

SSGBLUP计算BLUP值

image

2,BLUPF90怎么进行SSGBLUP分析

  • RENUMF90进行命令对数据预处理

  • BLUPF90进行SSGBLUP的计算(已知方差组分时)

  • AIREMLF90进行SSGBLUP方差组分估算(未知方差组分时)

  • PREGSF90进行H逆矩阵的计算

image

2.1 renumf90预处理数据

image

2.2 blupf90计算H矩阵以及育种值

image

2.3 pregsf90计算H矩阵

主要作用:

  • 根据基因组数据构建G矩阵

  • 根据系谱构建A矩阵

  • 根据公式构建H逆矩阵

image

3, 构建H矩阵的参数设置

image

image

4, 基因组数据的筛选

image

5, 亲子鉴定的作用

image

6, G矩阵结果数据挖掘

6.1 检测异常个体

G矩阵中,某些个体对角线有较高的值, 有可能这个个体不是群体内的个体, 可能来源其它群体或者家系, 或者call rate值较低.

image

6.2 检测重复样本

如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本

image

6.3 G矩阵和A22矩阵的关系

G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵, 他们应该是由很高的相似性. 如果对角线和非对角线相似度较低, 表明是有一些问题的. 需要引起重视, 可能是测序个体ID错误, 可能是数据量较少等等

image

6.4 根据基因组数据进行PCA分析

image

7, 构建A22矩阵时的高效方法

image

image

image

可以看出, 构建A22矩阵时, 使用57000系谱数据, 6500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb. 使用Colleau方法更合适

image

8, 使用BLUPF90构建H逆矩阵输出

如果想要使用DMU, ASREML或者WOMBAT利用blupf90构建好的H逆矩阵, 需要输出Original ID的形式. 然后转化为DMU和ASREML的格式即可.

image





http://blog.sciencenet.cn/blog-2577109-1172909.html

上一篇:测定日模型及随机模型介绍
下一篇:反对996为何是一场闹剧

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-1-21 01:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部