yzy2020的个人博客分享 http://blog.sciencenet.cn/u/yzy2020 技术体现的是术,可以通过多次练习掌握,不要迷恋术,idea是道,需要通过文献加强训练。总之,孰能生巧!

博文

[转载]orthofinder构建单拷贝基因发育树——相关命令参数

已有 1633 次阅读 2023-5-19 09:57 |个人分类:linux学习|系统分类:科研笔记|文章来源:转载

一、

1、conda activate orthofinder   #激活进入orthofinder,提前用conda安装好orthofinder及其环境变量

2、$nohup orthofinder -f co_evolution_protein/ -S diamond -M msa -T iqtree -t 200 -a 200 &

3、终端关闭,再次登录查看进程

jobs -l  #终端未关闭可用,选项可显示当前终端所有任务的PID,jobs的状态可以是running,stopped,Terminated:+ 号表示当前任务,- 号表示后一个任务。


#运行orthofinder:orthofinder -f ExampleData/ -S diamond -M msa -T raxml -t 8

①参数介绍及选择

orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 > orthofinder.log &

(注:&  表示任务在后台执行,如要在后台运行redis-server,则有  redis-server &)

orthofinder参数详情:

-t 并行序列搜索线程数(默认= 16)

-a 并行分析线程数(默认值= 1)

-M 基因树推断方法。可选:dendroblast和msa(默认= dendroblast)推荐msa

-S 序列搜索程序(默认= blast)选项:blast,mmseqs,,blast_gz,diamond(推荐使用diamond,比对速度很给力)

-A 多序列联配方式,需要添加参数-M msa时才有效;(默认= mafft)可选择:muscle,mafft

-T 建树方法,需要添加参数-M msa时才有效,(默认 = fasttree)可选:iqtree,raxml-ng,fasttree,raxml(推荐)

-s <文件> 可指定特定的根物种树

-I 设定MCL的通胀参数(默认 = 1.5)

-x Info用于以othoXML格式输出结果

-p 将临时pickle文件写入到

-l 只执行单向序列搜索

-n 名称以附加到结果目录

-h 打印帮助文本

如果只需要查找直系同源基因,只需接“-f” 参数即可;此步也可建树,采用默认的建树方法fasttree,为无根树。

nohup orthofinder -f Dataset &      (注:nohup 英文全称 no hang up(不挂起),用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行。)

如果添加-M msa -T iqtree设定制定参数,可按照设定的参数使用最大似然法构建有根的物种进化树,构建的树为STAG树。

nohup orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 2> orthofinder.log &

关于构建系统进化树,有很多种做法,常见的有利用物种全部的蛋白序列,构建STAG物种树;也有使用单拷贝直系同源基因构建的物种进化树,关于这一点,OrthoFinder查找同源基因,可以输出直系单拷贝同源基因的序列结果,后续也可使用其他构树软件及算法进行进化树构建。关于建树方法,则有距离矩阵法、最大简约法、最大似然法以及贝叶斯;当然目前主流采用的基本为最大似然法和贝叶斯,其中贝叶斯算法计算量巨大,耗时最久,其构建的树也认为最为“逼真”,但文章中使用较多的还是最大似然法,其耗时也需蛮久。



正式运行Orthofinder,相当简单的操作,-f输入目录,里面包含你需要运行的蛋白质fasta文件, -t 所用到的CPU数目。基本的用法就如下,更多的可以去manual中查看。

orthofinder -f Mycoplasma/ -t 2



作者:君子一诺
链接:https://www.jianshu.com/p/3bcd965605f5
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。




https://blog.sciencenet.cn/blog-3434047-1388591.html

上一篇:[转载]基因家族收缩和扩张分析
下一篇:[转载]系统发育树构建相关问题,直系同源的——DNA序列,or蛋白序列
收藏 IP: 221.11.67.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 18:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部