思想独立,个性自由分享 http://blog.sciencenet.cn/u/zls111 为自己的信仰而奋斗,为我们的未来而努力 http://baike.baidu.com/item/张亮生

博文

构建基因家族进化树答疑

已有 18112 次阅读 2014-12-9 22:12 |个人分类:读文章笔记|系统分类:科研笔记| 进化树, 基因家族

刚才有个同学咨询构建进化树问题。 觉得有代表性,贴出来供大家参考。



感谢您及时回复我的邮件。由于我之前在构建进化树方面曾经遇到一些困难,所以我在看到您的文章之后,想从网上把您构建进化的序列下载下来详细学习,所以遇到以下几个问题:

1)      Fig.1 中所用到的构建进化树的序列,并不是所有您在 Table 1中所展示的物种中的序列,所以我想请问您Fig.1 中所用到的物种的序列,是基于分类关系所选择还是基于进化树所选择?

 

选择代表性物种,是基于分类关系。

 

Ps:这里fig1等是指我最近发表的文章。见前面一篇博客。

2)      您在构建这个进化树的时候用到的是氨基酸全长序列,但是也有些文章中的用的Domain序列,应该如何选择?

 

如果序列不是很多,比如几百条,建议用全长。  还有就是序列不是太保守,要是序列之间相似度不高,只有domain相似度比较高,可能用domain比较好。大多用全长挺好的。

 

3)我之前也曾基于已经公布的植物基因组数据,使用HMMER软件通过domain的编号来寻找蛋白质氨基酸序列,并构建进化树,但是所得到的进化树,

无论是用全长序列还是domain序列,在主要分支上的支持率都比较低(MrbayesMLNJ),也曾结合protest软件选择最佳模型来构建发育树,但是结果也是不理想,您能给我一些好的建议吗?

 

序列比对完之后,你稍微看下你比对的结果,一些序列有明显差异的,就给去掉。另外一个办法,你做个NJ树,看看是不是有些序列跟谁也聚集不在一起,把这个序列删掉。在这个之后,你再画树看看。

 

另外,就是你选择代表性物种,不要弄很多。  

 

树不一定要支持度高就是好,,有的基因树本来就是那个样子,,哪就是那个样子。做树一般是进行分类,大多的树都是能把类分的清楚。  树是重构进化历史而已,能说明你想的问题就行。




https://blog.sciencenet.cn/blog-54593-849742.html

上一篇:我的文章在线了
下一篇:与ENCODE计划媲美的鸟类基因组计划
收藏 IP: 221.232.128.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-6 07:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部