||
最新版是2021-06-01更新,共有98页:
GCTA说明文档:https://yanglab.westlake.edu.cn/software/gcta/static/gcta_doc_latest.pdf
遗传力会是0或者1,标准误很大,不正常,不能分析小样本来的数据。Q1:GCTA-REML需要多少的样本? 如果要想达到比较小的标准误(0.1),至少要3160个不相关的样本。
Q2:为何遗传力的标准误很重要? 95%的置信区间是遗传力 +- 1.96*标准误,如果标准误比较大,那么95%的置信区间就比较大(比如0~1),这样意义不大了。
这里,介绍了不同的样本数,不同的SNP个数,计算所需要的内存。下面介绍,估算方差组分估计需要的内存。
下面介绍,LRT检验的实施方法。
如果内存报错,建议用64位的GCTA。因为32位最多支持4G内存,可能不够。
如果分析的是动物数据,需要设置染色体条数。
对于case-contral数据,可以设置--reml-no-constrain
,这样有可能遗传力大于1.
对于连续性状数据,样本量少的话,标准误比较大,有可能遗传力估计偏高。
GCTA可以按照下面操作,分析系谱或家系的数据。
结果可能会偏高。
可以,但是不准确。
0.5可以看做是一级的:亲子或者全同胞
0.25可以看做是二级的:半同胞或者爷孙
0.125可以看做是三级的:表兄,表妹「GCTA生成的GRM二进制文件读入到R中」两种方法:
1,通过R语言读取二进制文件
2,通过--make-grm-gz
,将二进制文件转化为文本文件
因为有标准误,数据量小时,标准误大。
可能本身遗传力就很低,考虑到标准误,会有可能负值。
方差组分中V不正定,可以尝试其它迭代方法---reml-lag 1
由AI迭代变为Fisher scoring,试一下。
❝欢迎关注我的公众号:
❞育种数据分析之放飞自我
。主要分享R语言,Python,育种数据分析,生物统计,数量遗传学,混合线性模型,GWAS和GS相关的知识。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-13 00:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社