||
【简介】MEGA 是时下使用最为广泛的系统发育分析软件之一,因其简单易用,深受广大生物工作者青睐,尤其MEGA5加入支持ML算法以来,更是频频见于各个SCI期刊。但图形化界面的MEGA一次只能运行单次的数据处理,无法完成批量数据分析,故MEGA6发布GUI版的同时,其命令行版Compute Core(CC)也随之发布。MEGA-CC主要通过命令行进行批量处理或流水线分析,适用于个人或小团队成员交互分析和工作流操作,也可以用于个人研究或教学,还可以用于服务器环境中。
【官网】:http://www.megasoftware.net/megaccusage.php
【流程】
(1)通过 M6Proto.exe 设置并生成所分析内容的参数(图形化界面操作);
(2)通过 M6CC.exe 根据参数执行分析内容,并生成结果(命令行操作);
【实例】演示MEGA6-CC进行建树序列最优模型的选择、应用最大似然法(ML)构建系统发育树。
第一部分
-----------------------------------------------------------------------------------
(1)参数设置
将待分析的序列以FASTA格式后,放在指定目录或复制到MEGA6-CC目录下,运行 M6Proto.exe 启动参数设置。
a. 根据序列类型选择格式,这里示例数据为编码某基因的核苷酸序列,所以选择Nucleotide(coding):
b. 分析选项,这里为模型选择,依次点击“Model”-“Find Best DNA/Protein Model (ML)”选项:
c.设置相关参数,完毕,“Saving settings”保存所设置的参数:-
d. 输入所保存参数的文件名,如:model,扩展名默认为mao:
(2)执行分析
a. 在Windows 的“开始”-输入“cmd”调出MS-dos界面:
通过cd等命令,转到MEGA6-CC所在的目录,并输入后面命令,并回车: M6CC.exe -a Model.mao -d Raindytest.fas -o Modelresults
注:
-a *.mao 分析选项的参数设置
-d *.fas 分析对象,可以是单条序列,如:*.fas,*.meg等
-o * 输出结果的文件名称,名称任意
如果需要批量处理多个数据(每个数据/行),可以将序列完全路径保存一个文本文件中,名称任意,扩展名为 txt,如下图:
批量处理数据的参考命令:
M6CC.exe -a Model.mao -d seqpath.txt -o Modelresults
M6CC命令行操作结果如下图所示:
(3)结果解读
*.csv 为各模型的具体数据;*_summary.txt 为运行日志概要内容:
*.csv 具体内容,如下图所示,可知示例数据最佳的进化模型为 JC+G:
第二部分
-----------------------------------------------------------------------------------
(1)设置分析选项的参数,此处为ML法建树,此处“Phylogeny”-“Construct/Test Maximum Likelihood Tree..”,其他同上,不再赘述。
设置ML法的参数,
Bootrap检验,replications 值至少1000;
模型为第一部分得到的JC+G模型--先选择Jukes-cantor Model,“Rate among sites ” 为Gamma:
设置完毕,保存参数为ML.mao文件:
(2)调用M66CC.exe 执行分析: -a ML.mao -d Raindytest.fas -o MLResults,回车!
用ML法构建系统发育树,运行界面如下图:
(3)结果解读
*.nwk 为原始树;
*_consensus.nwk 一致树;
*.summary.txt 运行日志概要内容
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 15:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社