批量Blast就是指多个序列的Blast。其实我也不明白为什么会有这么多人提这个问题,批量Blast就跟单个Blast一样的。
我们都知道,默认参数下的blastn是这样的:
blastall -p blastn -d BlastDB -i in_file.fasta >blast_output
当in_file.fasta里面只有一个序列时,就是单个Blast啊。in_file.fasta也可以放多个Fasta格式的序列,这样子就是批量Blast了。
当然了,麻烦的是批量Blast之后的结果,一个的话我们可以看得了,当批量上千个时,我们不可能一个个看到的。这种小事情Blast早就想到了。这就引进了-m8参数。-b5参数是指显示匹配的前5个结果(默认好像是500个,忘记了)。
blastall -p blastn -d BlastDB -i in_file.fasta -m8 -b5 >blast_output-m8参数的输出结果有12列,每一列的解释如下例子
Query_id,Subject_id,%identity,alignment_length,mismatches,gap_openings,q.start,q.end,s.start,s.end,e-value,bit_score
A_query B_Sbjct 97.61 585 3 3 309 886 94498 95078 0.0 1017
A_query B_Sbjct 100.00 303 0 0 913 1215 95092 95394 2e-172 601
A_query B_Sbjct 100.00 209 0 0 1 209 94196 94404 3e-116 414
A_query B_Sbjct 100.00 123 0 0 1234 1356 95413 95535 6e-65 244这样子的结果就方便后面的分析工作了。
推荐的命令行如下:
blastall -p blastn -d BlastDB -i in_file.fasta -m8 -b5 -b1 -a2 -FF >blast_output-a2参数是用二个CPU,加速。-FF是不过滤简单的重复序列和低复杂度的序列(默认是过滤的)。
其它更详细的参数,直接敲打blastall命令就能看到了。
https://blog.sciencenet.cn/blog-713614-603042.html
上一篇:
如何在PPT中插入其他幻灯保持母版不变下一篇:
如何在 PowerPoint中更改作为图片导出的幻灯片的分辨率