|||
刚才有个同学咨询构建进化树问题。 觉得有代表性,贴出来供大家参考。
感谢您及时回复我的邮件。由于我之前在构建进化树方面曾经遇到一些困难,所以我在看到您的文章之后,想从网上把您构建进化的序列下载下来详细学习,所以遇到以下几个问题:
1) Fig.1 中所用到的构建进化树的序列,并不是所有您在 Table 1中所展示的物种中的序列,所以我想请问您Fig.1 中所用到的物种的序列,是基于分类关系所选择还是基于进化树所选择?
选择代表性物种,是基于分类关系。
Ps:这里fig1等是指我最近发表的文章。见前面一篇博客。
2) 您在构建这个进化树的时候用到的是氨基酸全长序列,但是也有些文章中的用的Domain序列,应该如何选择?
如果序列不是很多,比如几百条,建议用全长。 还有就是序列不是太保守,要是序列之间相似度不高,只有domain相似度比较高,可能用domain比较好。大多用全长挺好的。
3)我之前也曾基于已经公布的植物基因组数据,使用HMMER软件通过domain的编号来寻找蛋白质氨基酸序列,并构建进化树,但是所得到的进化树,
无论是用全长序列还是domain序列,在主要分支上的支持率都比较低(Mrbayes、ML、NJ),也曾结合protest软件选择最佳模型来构建发育树,但是结果也是不理想,您能给我一些好的建议吗?
序列比对完之后,你稍微看下你比对的结果,一些序列有明显差异的,就给去掉。另外一个办法,你做个NJ树,看看是不是有些序列跟谁也聚集不在一起,把这个序列删掉。在这个之后,你再画树看看。
另外,就是你选择代表性物种,不要弄很多。
树不一定要支持度高就是好,,有的基因树本来就是那个样子,,哪就是那个样子。做树一般是进行分类,大多的树都是能把类分的清楚。 树是重构进化历史而已,能说明你想的问题就行。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 07:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社