||
BLUPF90号称遗传评估领域的三剑客之一(另外另个是 ASREML和DMU), 基因组时代的到来, BLUPF90应该是最先开发了支持基因组数据的模块, 并且里面的基因组数据过滤筛选非常友好, 它还有哪些神奇的功能呢?
SSGWAS, 之前的GWAS都是基于G矩阵或SNP数据, 现在同时可以利用系谱和SNP信息, 想不想试试SSGWAS呢?
PCA分析, 之前的PCA都是基于G矩阵或者SNP数据, 想不想试试H矩阵来进行群体划分呢?
亲子鉴定, 基因组时代的到来, 用于系谱矫正, 亲子鉴定, 可以试试BLUPF90的seekparents模块, 速度非常快!
重复样本和异常样本检查, BLUPF90的模块可以检查样本可能的重复或者异常, 非常好用.
H逆矩阵的输出与再利用, BLUPF90输出H逆矩阵, 可以很容易在DMU和ASREML中使用
http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf
传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵
根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)
RENUMF90进行命令对数据预处理
BLUPF90进行SSGBLUP的计算(已知方差组分时)
AIREMLF90进行SSGBLUP方差组分估算(未知方差组分时)
PREGSF90进行H逆矩阵的计算
主要作用:
根据基因组数据构建G矩阵
根据系谱构建A矩阵
根据公式构建H逆矩阵
G矩阵中,某些个体对角线有较高的值, 有可能这个个体不是群体内的个体, 可能来源其它群体或者家系, 或者call rate值较低.
如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本
G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵, 他们应该是由很高的相似性. 如果对角线和非对角线相似度较低, 表明是有一些问题的. 需要引起重视, 可能是测序个体ID错误, 可能是数据量较少等等
可以看出, 构建A22矩阵时, 使用57000系谱数据, 6500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb. 使用Colleau方法更合适
如果想要使用DMU, ASREML或者WOMBAT利用blupf90构建好的H逆矩阵, 需要输出Original ID的形式. 然后转化为DMU和ASREML的格式即可.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 18:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社