|||
在进行系统发育分析时需要通过构建系统发育树来描述物种之间的进化关系,主要是通过同源DNA的核苷酸序列或者同源蛋白质分子的氨基酸序列可以实现构建进化树。通过比对序列构建系统进化树的的基本假设是核苷酸和氨基酸序列中含有生物进化历史的全部信息。对于同源DNA的核苷酸序列,在其构建进化树之前,需要进行序列饱和度检验(Test of substitution saturation),如果核苷酸序列趋向于饱和,这时建树的意义不大。
什么是核苷酸替换,从字面的意思理解即可,就是在进化过程中,DNA核苷酸序列中的某一个或者某些碱基发生了替换(在进行系统发育分析中,当同源序列替换次数太多时序列中包含有用的系统发育信息就很少,此时就不能使用该序列继续构建进化树)。
一、为什么需要做序列饱和度检验
替换饱和降低了序列中包含的系统发育信息,并影响了涉及深部分支的系统发育分析。在极端情况下,当序列已经经历了完全替代饱和,序列之间的相似性将完全依赖于核苷酸频率的相似性,通常不反映系统发育关系。因此,在构建进化树之前,需要对序列进行饱和度检测,即检测序列中是否包含系统发育信息。
二、序列饱和度检测的方法
目前主要有五种方法用于检测序列中是否包含系统发育信息(饱和度检测)
the randomization or permutation tests(Archie, 1989; Faith, 1991)
the standard g1 statistic for measuring the skewness of tree lengths of alternative trees(Swofford,1993)
a tree-independent measure based on relative apparent synapomorphy(Lyons-Weiler et al., 1996)
parsimony method(Steel et al., 1993, 1995)
an information entropy-based index of substitution saturation(Xia et al., 2003)
三、如何做序列饱和度检验(软件操作)
这里主要介绍DAMBE 软件(data analysis in molecular biology and evolution)的具体操作步骤,下载传送门。
加载数据,然后会弹出下面的界面框,根据自己的实际数据选择。
点击Go后,弹出下面的对话框,翻译过来的意思就是你是否想保留unique序列,言外之意就是相同的序列只保留一条(序列两两比较,比较两者之中核苷酸的变化)。选是的话会剔除相同的序列保留一条,选否的话会全部保留,然后相同的序列会列表形式给出。这里选否为例。
剔除的相同序列以列表形式给出。
接下来seq.analysis-> measure substitution saturation -> test by xia et al.
当Iss<Iss.c,且p<0.05时候,说明序列未饱和,可以进行系统发育分析。
References:
Xia X, Lemey P. Assessing substitution saturation with DAMBE[J]. The phylogenetic handbook: a practical approach to DNA and protein phylogeny, 2009, 2: 615-630.
转自https://zhuanlan.zhihu.com/p/31977387
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 18:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社