||
外面下着雨,
笔记计划分为六篇:
第二篇:对基因型数据质控:缺失质控,maf质控,hwe质控,样本质控
第三篇:基因型数据可视化:kingship,LD,MDS,PCA
第四篇:一般线性模型进行GWAS分析(GLM模型)
第五篇:混合线性模型进行GWAS分析(MLM模型)
第六篇:TASSEL结果可视化:QQ plot,曼哈顿图
已完成前三篇,本篇是第四篇。
质控后的plink数据和表型数据:
「读取表型数据到TASSEL中:」
「读取基因型数据到TASSEL中:」
GLM模型中,将每个SNP作为固定因子进行回归分析,进行显著性检验,P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考虑,就放到协变量里面,比如性别,PCA,Q矩阵等。
重点是对每个SNP做回归分析,提取effect和p-value。
TASSEL分析中,需要将分析的表型和基因型数据进行合并,合并为一个数据框,然后对该数据框进行分析。
选中qc_plink基因型数据,点击菜单 Analysis --> Relatedness --> PCA,然后点击确定即可。
「PCA分析结果:」
选中三个数据,然后点击Data中的Intersect Join,进行数据合并。
可以看到,数据中包括ID,PCA及结果,表型性状数据,基因型数据。
选中合并后的书,点击Analysis --> Association --> GLM点击OK,即可。
可以看到,Result中有两个GLM结果,第一个为GWAS结果,第二个为每个SNP的效应值情况。看第一个就行。因为这是多个性状的分析,所以所有结果放在了一起。
「QQ图:」
「曼哈顿图:」
这里,曼哈顿图需要指定性状,这里我们选择EarDia这个性状进行可视化:
图片可以保存到本地。
ok,鸽了一个月,第四篇搞定了。下一篇是MLM模型的分析,欢迎继续关注。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 21:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社