|||
使用RAxML分割数据并构建最大似然树(ML树)
熊荣川
六盘水师范学院生物信息学实验室
http://blog.sciencenet.cn/u/Bearjazz
现在分子系统学的倾向是用于构建系统发育树的基因越来越多,这就把以前一直觉得不那么重要的问题提到了一个非常显著的位置——即同时用于构建系统发育树的各个基因由于在物种进化过程中的受到的选择压力的差异不同导致它们的进化速率各不相同。这个时候出于科学谨慎的态度来说,应该对不同的基因及编码基因的不同密码子位进行数据分割和模型筛选。
可能是笔者阅读文献不够广泛,总觉的之前的很多研究在构建最大似然树时,没有多少考虑数据分割的,常见的是把多个基因串联起来使用一个替换模型。随着我们以上提到的趋势,这种处理将变得越来越经不起推敲。因此,在构建ML树中考虑数据的分割变得非常必要。
本文将简单介绍怎样使用软件RAxML进行数据的分割并构建系统发育树。
首先在同一个文件夹中需要4个文件
1, 建树程序,raxmlHPC.exe。
2, 一个批处理命令文件,使用记事本新建,保存为后缀名为bat的文件,如“bear.bat”
内容如下
raxmlHPC -x 12345 -p 12345 -# 1000 -m GTRGAMMA -o planti -s odorchuan.phy -f a -q odorpar3.txt -n TESTodorchuan
以上命令注释如下
-# bootstrap的次数
-o planti 设置planti为外群
-s odorchuan.phy 输入序列为odorchuan.phy
-q odorpar3.txt 数据分割信息文件
-n TESTodorchuan输出文件中包含字符“TESTodorchuan”
3, 你比对好的分子序列,要求为philip格式,例如” bear.phy”
4,一个关于数据分割的附件文件,格式没有要求,这里我们用记事本新建,保存为bearpartition.txt其中内容如下:
DNA, gene1 = 1-673
DNA, gene2 = 674-747
DNA, gene3codon1 = 748-9503
DNA, gene3codon2 = 749-9503
DNA, gene3codon3 = 750-9503
以上文件准备完毕,双击bat文件开始运行程序。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-4 18:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社