vesperlight的个人博客分享 http://blog.sciencenet.cn/u/vesperlight

博文

序列多重比对工具:MUSCLE

已有 20133 次阅读 2017-8-15 09:27 |个人分类:生信|系统分类:科研笔记| sequence, multiple, alignment, 多重比对, MSA

Muscle

MUSCLE是RC Edgar开发的序列多重比对(Multiple Sequence Alignment,MSA)工具

下载和相关说明地址为http://www.drive5.com/muscle/manual/


1、比对并保存比对结果为Fasta格式文件


 muscle -in seqs.fa -out seqs.afa


对于大数据集可以使用


 muscle -in seqs.fa -out seqs.afa -maxiters 2


MUSCLE默认使用高准确度的比对方式,若需要更快但精度较低的方法可以使用:

用于氨基酸序列比对

 muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags -sv -distance1 kbit20_3


用于核算序列比对

 muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags


2、将比对结果转换为CLUSTALW格式的文件


 muscle -in seqs.fa -clw


参数

-in 输入文件必须为fasta格式,如果序列中存在gaps,gaps将会被丢弃

-out 输出文件


3、根据多重比对结果构建UPGMA树


muscle -maketree -in seqs.afa -out seqs.phy


4、根据多重比对结果构建NJ(Neighbor-Joining)树


 muscle -maketree -in seqs.afa -out seqs.phy -cluster neighborjoining


5、对已有比对结果加入新的序列

已有一个msa结果,想加入一条新的序列

 muscle -profile -in1 existing_msa.afa -in2 new_seq.fa -out combined.afa


6、如果序列有多条,则先对需要加入的序列进行多重比对,然后对两个多重比对结果进行比对(同下)


 muscle -in new_seqs.fa -out new_seqs.afa


 muscle -profile -in1 existing_aln.afa -in2 new_seqs.afa -out combined.afas


7、两个比对结果进行比对

 muscle -profile -in1 one.afa -in2 two.afa -out both.afa


8、提炼已有MSA

 muscle -in msa.afa -out refined_msa.afa -refine




https://blog.sciencenet.cn/blog-2379401-1071168.html

上一篇:基因预测工具:Glimmer
下一篇:基因预测工具:Prodigal
收藏 IP: 223.85.248.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-14 02:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部