|||
一、
1、conda activate orthofinder #激活进入orthofinder,提前用conda安装好orthofinder及其环境变量
2、$nohup orthofinder -f co_evolution_protein/ -S diamond -M msa -T iqtree -t 200 -a 200 &
3、终端关闭,再次登录查看进程
jobs -l #终端未关闭可用,选项可显示当前终端所有任务的PID,jobs的状态可以是running,stopped,Terminated:+ 号表示当前任务,- 号表示后一个任务。
#运行orthofinder:orthofinder -f ExampleData/ -S diamond -M msa -T raxml -t 8
orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 > orthofinder.log &
(注:& 表示任务在后台执行,如要在后台运行redis-server,则有 redis-server &)
orthofinder参数详情:
-t 并行序列搜索线程数(默认= 16)
-a 并行分析线程数(默认值= 1)
-M 基因树推断方法。可选:dendroblast和msa(默认= dendroblast)推荐msa
-S 序列搜索程序(默认= blast)选项:blast,mmseqs,,blast_gz,diamond(推荐使用diamond,比对速度很给力)
-A 多序列联配方式,需要添加参数-M msa时才有效;(默认= mafft)可选择:muscle,mafft
-T 建树方法,需要添加参数-M msa时才有效,(默认 = fasttree)可选:iqtree,raxml-ng,fasttree,raxml(推荐)
-s <文件> 可指定特定的根物种树
-I 设定MCL的通胀参数(默认 = 1.5)
-x Info用于以othoXML格式输出结果
-p 将临时pickle文件写入到
-l 只执行单向序列搜索
-n 名称以附加到结果目录
-h 打印帮助文本
如果只需要查找直系同源基因,只需接“-f” 参数即可;此步也可建树,采用默认的建树方法fasttree,为无根树。
nohup orthofinder -f Dataset & (注:nohup 英文全称 no hang up(不挂起),用于在系统后台不挂断地运行命令,退出终端不会影响程序的运行。)
如果添加-M msa -T iqtree设定制定参数,可按照设定的参数使用最大似然法构建有根的物种进化树,构建的树为STAG树。
nohup orthofinder -f Dataset -M msa -S diamond -T iqtree -t 24 -a 24 2> orthofinder.log &
关于构建系统进化树,有很多种做法,常见的有利用物种全部的蛋白序列,构建STAG物种树;也有使用单拷贝直系同源基因构建的物种进化树,关于这一点,OrthoFinder查找同源基因,可以输出直系单拷贝同源基因的序列结果,后续也可使用其他构树软件及算法进行进化树构建。关于建树方法,则有距离矩阵法、最大简约法、最大似然法以及贝叶斯;当然目前主流采用的基本为最大似然法和贝叶斯,其中贝叶斯算法计算量巨大,耗时最久,其构建的树也认为最为“逼真”,但文章中使用较多的还是最大似然法,其耗时也需蛮久。
正式运行Orthofinder,相当简单的操作,-f输入目录,里面包含你需要运行的蛋白质fasta文件, -t 所用到的CPU数目。基本的用法就如下,更多的可以去manual中查看。
orthofinder -f Mycoplasma/ -t 2
作者:君子一诺
链接:https://www.jianshu.com/p/3bcd965605f5
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 00:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社