||
【絮语】
系统发育分析中,最大似然法(ML)和贝叶斯法(BI)是对替换模型非常敏感的两种算法,因此利用ML法或BI法重建系统发育树前,核苷酸替换模型的选择是必不可少的过程。目前,核苷酸替换模型的选择软件目前常见有MrModelTest、ModelTest和jModelTest等,前两者以命令行操作,虽然借助 MrMTgui 等程序可以实现GUI界面化的操作,但必须借助PAUP的内核。而jModelTest 是个跨平台的Java程序,可以独立运行,通过内置的PhyML等程序计算模型及相关参数,故而相对于 MrMTgui 操作更为简单,实用性更强。由于jModeltest 支持的模型更多,近年来备受不同用户的喜爱,频频现于各类SCI期刊。
本文通过图解方式,简要介绍一下利用jModelTest获得核苷酸替代模型及相关参数。
【流程】
1. 载入DNA比对序列:通过菜单“File”-“Load DNA alignment”载入比对好的序列文件,支持格式:fasta、nexus、phylip等ReadSeq可以识别的格式(jModelTest内置了ReadSeq软件用于转化序列数据):
2.计算似然值:依次点击菜单栏 “Analysis”-“Compute Likelihood scores” ,程序自动调用PhyML计算模型的似然值及相关参数:
似然参数设置:
(1)模型方案有5个模型体系选项,分别是3、5、7、11、203,这些模型结合碱基频率和速率变异参数(默认选择)等可以有24-1624个模型可供选择。模型越多,有助于提高建树的精确度,但前提是需要相关建树软件的支持,否则模型再多,也无用武之地。
(2)计算似然树中使用的树:前项目是两个固定树适用于计算采用LRT标准的模型;后两项分别是BOINJ树(基于JC校正距离)和ML优化树,大数据集优先推荐用BIONJ树,其他情况建议用ML优化树。
在jModelTest V2.1.4中添加一个“Base tree search”选项,推荐选用 Best,即:同时使用 NNI 和 SPR 算法,并选择其中最佳的一个。
3. 选择一个计算标准:有AIC、BIC和DT等标准,标准不同,所选的模型可能会不一致,此时推荐使用AIC或BIC标准,本例以常见的AIC标准为示范,BIC类似,在此不赘述。
AIC 设置:有四个选项,计算参数重要性(权重)、模型平均化为默认选中选项。当第一个选项AICc选中,Sample size读框内会自动读取序列的长度大小;如果需要得到PAUP模块的命令参数,请选中“Write PAUP* block”。
4. 显示结果表:可以简要显示模型的参数值
将标签切到“AICc”上,最匹配的模型会以红色加亮显示(也可以通过查看 detaAICc值,如果该值为0,即为计算得到的最佳进化模型)
5. 生成网页格式的日志: 将日志以HTML网页格式显示
6. 查看模型选择结果及参数:查找“Model selected”内容,即为选定的最佳模型及相关参数。
7. 模型参数的应用:将得到的最佳模型及参数应用于相关的建树软件,如:BEAST、MrBayes、PhyML、PAUP等。下图为Beauti 2 根据相关相关参数进行设置:
Raindy注:上图的Kappa 即:HKY transition-transversion parameter,与大小的K不是一个概念,即:Optimized free parameters (K) = substitution parameters + 9 branch lengths + topology
附:jModelTest 和 MrmodelTest 结果比较
Graphical User Interface:https://code.google.com/p/jmodeltest2/wiki/QuickStartGUI ;
Quick Start (Console interface):https://code.google.com/p/jmodeltest2/wiki/QuickStartConsole ;
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 10:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社