转载至陈老师: http://www.chenlianfu.com/?p=2217
ProtTest 用来进行最优氨基酸替代模型的选择。相应的,适用于核苷酸的软件是 jModeltest。
ProtTest 通过 PhyML 对进化树和模型参数的最大似然估计,通过 AIC, BIC 分值或 DT 来寻找最佳模型。分值越小越优。
ProTest 3.2 版本包含 15 种不同类型的 rate matrices;考虑到位点的 rate variation (+I:
invariable sites; +G: gamma-distributed rates) 和 observed amino acid
frequencies (+F), 共有 120 种不同的模型。
ProtTest 官网:https://code.google.com/p/prottest3/
参考文献:ProtTest 3: fast selection of best-fit models of protein evolution
$ tar zxf prottest-3.4-20140123.tar.gz -C /opt/biosoft $ cd /opt/biosoft/prottest-3.4-20140123 $ echo 'export PROTTEST_HOME=/opt/biosoft/prottest-3.4-20140123' >> ~/.bashrc 查看说明文档: $ less README
ProtTest 使用 JAVA 编写,有图形化和命令行两种运行模式。
必须要进入到程序的所在的目录运行程序以启动图形化界面 $ cd /opt/biosoft/prottest-3.4-20140123/runXProtTestHPC.sh $ runXProtTestHPC.sh
启动 JAVA 界面后,点击 File–Load Alignment, 上传多序列比对结果;然后点击 Analysis–Compute likehood scores, 选择所使用的线程数,以及候选模型的选择,和计算 likelihood 的 topology;然后点击 Compute, 进行计算,所需要消耗的实际有点长;计算完毕后,点击 Selection–Results 来查看结果。通过 AIC, BIC, AICc 和 DT 来查看其得分,点击表格的第1行进行排序,寻找分值最小的模型作为最优氨基酸替代模型。
不加参数运行,则给出帮助文档: java -jar /opt/biosoft/prottest-3.4-20140123/prottest-3.4.jar 常用的命令行: java -jar /opt/biosoft/prottest-3.4-20140123/prottest-3.4.jar -i proteins.phy -all-distributions -F -AIC -BIC -tc 0.5 -threads 24 -o prottest.out
ProtTest 的常用参数:
-i alignment_filename 必须参数,输入多序列比对结果文件。 -o output_filename 输出的文件名。不设置,则默认输出到标准输出。 -[matrix] 指定需要分析的 matrix 。 该 matrix 可以被替换为 JTT LG DCMut MtREV MtMam MtArt Dayhoff WAG RtREV CpREV Blosum62 VT HIVb HIVw FLU 这 15 种 matrix。 若不指定,则默认全选。 -all-distributions 指定 matrix 模型结合 I 或 G 或 I+G -F 指定 matrix 模型结合 empirical frenquency estimation -AIC 输出结果中按 AIC (Akaike Information Criterion) 排序 -BIC 输出结果中按 BIC (Bayesian Information Criterion) 排序 -AICC 输出结果中按 AICc (Corrected Akaike Information Criterion) 排序 -DT 输出结果中按 DT (Decision Theory Criterion) 排序 -tc consensus_threshold 输出满足指定阈值的一致树。该值在 0.5~ 1.0 之间。[0.5 = majority rule consensus ; 1.0 = strict consensus] -threads number_of_threads 使用的 CPU 数。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 18:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社