fish2012的个人博客分享 http://blog.sciencenet.cn/u/fish2012

博文

如何本地批量BLAST

已有 18871 次阅读 2012-8-17 08:10 |系统分类:科研笔记| 如何

批量Blast就是指多个序列的Blast。其实我也不明白为什么会有这么多人提这个问题,批量Blast就跟单个Blast一样的。
我们都知道,默认参数下的blastn是这样的:
blastall -p blastn -d BlastDB -i in_file.fasta  >blast_output
当in_file.fasta里面只有一个序列时,就是单个Blast啊。in_file.fasta也可以放多个Fasta格式的序列,这样子就是批量Blast了。
当然了,麻烦的是批量Blast之后的结果,一个的话我们可以看得了,当批量上千个时,我们不可能一个个看到的。这种小事情Blast早就想到了。这就引进了-m8参数。-b5参数是指显示匹配的前5个结果(默认好像是500个,忘记了)。
blastall -p blastn -d BlastDB -i in_file.fasta  -m8 -b5 >blast_output-m8参数的输出结果有12列,每一列的解释如下例子
Query_id,Subject_id,%identity,alignment_length,mismatches,gap_openings,q.start,q.end,s.start,s.end,e-value,bit_score
A_query    B_Sbjct    97.61    585    3    3    309    886    94498    95078    0.0    1017
A_query    B_Sbjct    100.00    303    0    0    913    1215    95092    95394    2e-172    601
A_query    B_Sbjct    100.00    209    0    0    1    209    94196    94404    3e-116    414
A_query    B_Sbjct    100.00    123    0    0    1234    1356    95413    95535    6e-65    244这样子的结果就方便后面的分析工作了。
推荐的命令行如下:
blastall -p blastn -d BlastDB -i in_file.fasta  -m8 -b5 -b1 -a2 -FF >blast_output-a2参数是用二个CPU,加速。-FF是不过滤简单的重复序列和低复杂度的序列(默认是过滤的)。
其它更详细的参数,直接敲打blastall命令就能看到了。


https://blog.sciencenet.cn/blog-713614-603042.html

上一篇:如何在PPT中插入其他幻灯保持母版不变
下一篇:如何在 PowerPoint中更改作为图片导出的幻灯片的分辨率
收藏 IP: 159.226.149.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 11:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部