博文

[转载]使用 ProtTest 来选择最优氨基酸替代模型

已有 2155 次阅读 2023-5-19 22:04 |个人分类:linux学习|系统分类:科研笔记|文章来源:转载

转载至陈老师: http://www.chenlianfu.com/?p=2217

使用 ProtTest 来选择最优氨基酸替代模型

发表于2014 年 7 月 7 日

1. ProtTest 简介

ProtTest 用来进行最优氨基酸替代模型的选择。相应的，适用于核苷酸的软件是 jModeltest。
ProtTest 通过 PhyML 对进化树和模型参数的最大似然估计，通过 AIC, BIC 分值或 DT 来寻找最佳模型。分值越小越优。
ProTest 3.2 版本包含 15 种不同类型的 rate matrices；考虑到位点的 rate variation (+I: invariable sites; +G: gamma-distributed rates) 和 observed amino acid frequencies (+F), 共有 120 种不同的模型。
ProtTest 官网：https://code.google.com/p/prottest3/
从此处下载该软件。可能需要设置代理后下载。
参考文献：ProtTest 3: fast selection of best-fit models of protein evolution

2. ProtTest 下载和安装

$ tar zxf prottest-3.4-20140123.tar.gz -C /opt/biosoft
$ cd /opt/biosoft/prottest-3.4-20140123
$ echo 'export PROTTEST_HOME=/opt/biosoft/prottest-3.4-20140123' >> ~/.bashrc
查看说明文档：
$ less README

3. ProtTest 的使用

ProtTest 使用 JAVA 编写，有图形化和命令行两种运行模式。

3.1 图形化界面使用

必须要进入到程序的所在的目录运行程序以启动图形化界面
$ cd /opt/biosoft/prottest-3.4-20140123/runXProtTestHPC.sh
$ runXProtTestHPC.sh

启动 JAVA 界面后，点击 File–Load Alignment, 上传多序列比对结果；然后点击 Analysis–Compute likehood scores, 选择所使用的线程数，以及候选模型的选择，和计算 likelihood 的 topology；然后点击 Compute, 进行计算，所需要消耗的实际有点长；计算完毕后，点击 Selection–Results 来查看结果。通过 AIC, BIC, AICc 和 DT 来查看其得分，点击表格的第1行进行排序，寻找分值最小的模型作为最优氨基酸替代模型。

3.2 命令行运行

常用例子：

不加参数运行，则给出帮助文档：
java -jar /opt/biosoft/prottest-3.4-20140123/prottest-3.4.jar

常用的命令行：
java -jar /opt/biosoft/prottest-3.4-20140123/prottest-3.4.jar -i proteins.phy -all-distributions -F -AIC -BIC -tc 0.5 -threads 24 -o prottest.out

ProtTest 的常用参数：

-i alignment_filename
必须参数，输入多序列比对结果文件。
-o output_filename
输出的文件名。不设置，则默认输出到标准输出。
-[matrix]
指定需要分析的 matrix 。 该 matrix 可以被替换为 JTT LG DCMut MtREV MtMam MtArt Dayhoff WAG RtREV CpREV Blosum62 VT HIVb HIVw FLU 这 15 种 matrix。 若不指定，则默认全选。
-all-distributions
指定 matrix 模型结合 I 或 G 或 I+G
-F
指定 matrix 模型结合 empirical frenquency estimation
-AIC
输出结果中按 AIC (Akaike Information Criterion) 排序
-BIC
输出结果中按 BIC (Bayesian Information Criterion) 排序
-AICC
输出结果中按 AICc (Corrected Akaike Information Criterion) 排序
-DT
输出结果中按 DT (Decision Theory Criterion) 排序
-tc consensus_threshold
输出满足指定阈值的一致树。该值在 0.5~ 1.0 之间。[0.5 = majority rule consensus ; 1.0 = strict consensus]
-threads number_of_threads
使用的 CPU 数。

转载本文请联系原作者获取授权，同时请注明本文来自杨志远科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3434047-1388664.html

上一篇：[转载]系统发育树构建相关问题，直系同源的——DNA序列，or蛋白序列
下一篇：[转载]MrBayes 操作说明

收藏 IP: 221.11.67.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

杨志远

扫一扫，分享此博文

yzy2020的个人博客分享 http://blog.sciencenet.cn/u/yzy2020 技术体现的是术，可以通过多次练习掌握，不要迷恋术，idea是道，需要通过文献加强训练。总之，孰能生巧！

博文

[转载]使用 ProtTest 来选择最优氨基酸替代模型

使用 ProtTest 来选择最优氨基酸替代模型

1. ProtTest 简介

2. ProtTest 下载和安装

3. ProtTest 的使用

3.1 图形化界面使用

3.2 命令行运行

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

杨志远

全部作者的其他最新博文

全部精选博文导读

yzy2020的个人博客分享 http://blog.sciencenet.cn/u/yzy2020 技术体现的是术，可以通过多次练习掌握，不要迷恋术，idea是道，需要通过文献加强训练。总之，孰能生巧！

博文

[转载]使用 ProtTest 来选择最优氨基酸替代模型

1. ProtTest 简介

2. ProtTest 下载和安装

3. ProtTest 的使用

3.1 图形化界面使用

3.2 命令行运行

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

杨志远

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)