||
基因组选择, 预测杂种优势, 在水稻可以用, 在玉米, 高粱中也可以用, 在动物选择配套系时也可以用, 根据加性效应和非加性效应进行预测. 前景广阔.
这篇文章的作者, 有很多大牛, 徐世忠老师, 专门做算法的, 张启发老师, 水稻大牛, 文章本身没有数据源, 使用已有数据, 去挖掘信息, 这才是数据分析师应该有的范…
Genomic hybrid breeding is a technology that uses whole genome markers to predict future hybrids.
10倍交叉验证(cross validation), 10个农艺性状的准确性从0.35~0.92.
杂交种, 利用杂种优势, 产量提高20%以上, 但是如何选择合适的亲本进行杂交是一个难点. 如果自交系比较多, 那么所有可能的杂交种很多, 进行所有可能的杂交不现实, 因此有很多折中的方法, 比如类群划分, 群间杂交…基因组选择的出现, 可以利用建模的方式模拟预测所有可能的杂交种的表现, 然后进行选择, 再根据结果进行实地种植测试, 可以节约很多资源.
利用基因组选择预测杂交种表现很有前景, 因为可以根据亲本信息(基因型和表型)预测所有可能的杂交种的表现, 这样在没有杂交之前就能够预测杂交种的表现, 然后根据结果进行杂交试验, 这样可以节约大量的资源和成本, 不用做无用的杂交, 不用种植无用的杂交种…
预测杂交种育种值的模型有很多, 比如BLUP, LASSO, BayesB, 经验Bayes等. 这些模型的预测能力基本类似.
但是, 当SNP和样本数都很大时, LASSO和其它多元回归的方法会跪掉, 因为这些模型能不能估算太多的效应. 基于BLUP的方法更优秀, 因为:BLUP的方法不需要估计每个SNP的效应值, 它仅仅利用SNP估算个体间的亲缘关系矩阵, 然后带入混合线性方程组中计算育种值
大致来说, 预测的准确性 = 遗传力的平方根:
$$ accur = \sqrt{h^2} $$
权重如下:
模型1
y = u + A
模型2
y = u + A + D
模型3
y = u + A + GbyE
结果显示, 考虑线性效应和基因与环境互作效应, 没有显著提高预测的准确性.
1495杂交种的测序数据
-q 20 -q 40
, 共获得1.6 millin SNPs3K 水稻基因组项目测序数据
SNP编码
DNA测序数据再European Nucleotide Archive(www.ebi.ac.uk/ena), 编号为: ERP005527.
3K SNP 数据保存在 Rice SNP-Seek Database(http://snp-seek.irri.rog). 所有相关的数据和R代码, 可以联系作者索要.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 12:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社