育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

blupf90的无敌与寂寞

已有 3762 次阅读 2019-5-9 17:35 |个人分类:数量遗传学|系统分类:科研笔记

写在最前面

BLUPF90号称遗传评估领域的三剑客之一(另外另个是 ASREML和DMU), 基因组时代的到来, BLUPF90应该是最先开发了支持基因组数据的模块, 并且里面的基因组数据过滤筛选非常友好, 它还有哪些神奇的功能呢?

  • SSGWAS, 之前的GWAS都是基于G矩阵或SNP数据, 现在同时可以利用系谱和SNP信息, 想不想试试SSGWAS呢?

  • PCA分析, 之前的PCA都是基于G矩阵或者SNP数据, 想不想试试H矩阵来进行群体划分呢?

  • 亲子鉴定, 基因组时代的到来, 用于系谱矫正, 亲子鉴定, 可以试试BLUPF90的seekparents模块, 速度非常快!

  • 重复样本和异常样本检查, BLUPF90的模块可以检查样本可能的重复或者异常, 非常好用.

  • H逆矩阵的输出与再利用, BLUPF90输出H逆矩阵, 可以很容易在DMU和ASREML中使用

参考文献

http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf

image

1,ABLUP VS SSGBLUP

传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵

image

1.1 传统的动物模型计算BLUP值

根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)

image

1.2 SSGBLUP计算BLUP值

image

2,BLUPF90怎么进行SSGBLUP分析

  • RENUMF90进行命令对数据预处理

  • BLUPF90进行SSGBLUP的计算(已知方差组分时)

  • AIREMLF90进行SSGBLUP方差组分估算(未知方差组分时)

  • PREGSF90进行H逆矩阵的计算

image

2.1 renumf90预处理数据

image

2.2 blupf90计算H矩阵以及育种值

image

2.3 pregsf90计算H矩阵

主要作用:

  • 根据基因组数据构建G矩阵

  • 根据系谱构建A矩阵

  • 根据公式构建H逆矩阵

image

3, 构建H矩阵的参数设置

image

image

4, 基因组数据的筛选

image

5, 亲子鉴定的作用

image

6, G矩阵结果数据挖掘

6.1 检测异常个体

G矩阵中,某些个体对角线有较高的值, 有可能这个个体不是群体内的个体, 可能来源其它群体或者家系, 或者call rate值较低.

image

6.2 检测重复样本

如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本

image

6.3 G矩阵和A22矩阵的关系

G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵, 他们应该是由很高的相似性. 如果对角线和非对角线相似度较低, 表明是有一些问题的. 需要引起重视, 可能是测序个体ID错误, 可能是数据量较少等等

image

6.4 根据基因组数据进行PCA分析

image

7, 构建A22矩阵时的高效方法

image

image

image

可以看出, 构建A22矩阵时, 使用57000系谱数据, 6500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb. 使用Colleau方法更合适

image

8, 使用BLUPF90构建H逆矩阵输出

如果想要使用DMU, ASREML或者WOMBAT利用blupf90构建好的H逆矩阵, 需要输出Original ID的形式. 然后转化为DMU和ASREML的格式即可.

image




https://blog.sciencenet.cn/blog-2577109-1178063.html

上一篇:Linux中xargs命令的使用方法
下一篇:DMU在windows下安装测试—外篇1
收藏 IP: 47.52.231.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 22:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部