【絮语】
群体进化分析过程,经常要涉及群体结构分析,其中Structrue是分析群体结构组分的常用软件,本博文详细图解Structure分析的相关细节,首发于本人QQ空间(http://user.qzone.qq.com/58001704),如需转载,请保留作者信息,谢谢!
【相关软件 】数据格式转化:GenAIEx、 xmfaconvertor、xmfa2struct
群体结构分析:Structrue 最佳K值的确定:Structure Harvester (在线工具) Clusters 重复抽样分析: CLUMPP、CLUMPAK图形化显示结果:distruct 相关软件可以访问Structure官方网站下载: http://pritchardlab.stanford.edu/structure.html 【操作流程】 1. 不同数据源格式转换 不同的分析软件对输入格式都有一定的要求,Structure支持多种数据源,如:SSR数据、SNPs、序列数据等。除了序列数据外,大多数数据可以利用Excel的一个插件GenAIEx进行转换 ,此类教程网上较多,本文不再赘述;对于纯序列类型转为Structure格式的教程尚未多见,故本文以纯序列为数据源进行示例图解说明。(1)在Clustalx中打开比对好的序列文件,将其另存(Save sequences as)为Clustal格式,如下图所示,完成得到一个*.aln文件名; (2)启动xmfaConvertor软件,将标签切换为“File”上,点击“In File”按钮,选择上一步转好的*.aln文件,并选择输出文件路径,设置完毕,点击OK即可,转换完成程序界面的左下角会提示“Successfully Done”说明序列格式转为XMFA格式(eXtended Multi-Fasta Alignment ) 成功。 延伸阅读: Porras-Hurtado L, Ruiz Y, Santos C, Phillips C, Carracedo A, Lareu MV (2013) An overview of STRUCTURE: applications, parameter settings, and supporting software. Frontiers in genetics 4:98
SCI 美图: 常见问题:1. CLUMPP重复抽样分析这一步是否可以忽略?很多人都直接从结果随机选择一个xxx_runx_f文件进行绘制图。殊不知,这样生成的结果太为主观,因为同个K值的不同runs,所得到的Q-Matrix值不尽然相同,因此需要进行重复分析。
2. K 值的范围怎么选择?
K值一般从2开始
转载本文请联系原作者获取授权,同时请注明本文来自高芳銮科学网博客。 链接地址: https://blog.sciencenet.cn/blog-460481-967774.html
上一篇:
正选择分析之 Branch site model 篇(By Raindy) 下一篇:
EasyCodeML 使用指南