mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

二代测序短序列mapping新选择:Magic-BLAST

已有 6862 次阅读 2017-3-3 17:47 |系统分类:科研笔记| Mapping, blast, MagicBLAST, 短序列, short-read

Magic-BLAST is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome.

前面一段 时间看到NCBI上blast出了一个新系列,短序列的mapping。基本与blast使用体验一致。Magic-BLAST 也适用于长片段mapping,比如EST。最好调整默认的参数。
科学网博客排版不是很好,详细参见 二代测序短序列mapping新选择:Magic-BLAST

1、下载

官网下载(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/magicblast/LATEST)

我下载的是编译之后的,下载之后将magicblast和makeblastdb拷贝至系统全局变量路径即可。

2、使用

对经常使用blast的人来说使用非常简单。甚至不用将reference序列建库,直接使用fasta格式的序列文件即可。比如:

magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -subject ref.fa  -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T

其实,如果前面使用过makeblastdb将参考基因组建库,magicblast可以直接使用。比如

magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -db /data2/Fshare/IWGSC_v1.0_Formatdb/CS_v1.0_full -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T #如果是DNA_seq ,需要将 -splice  设为 F

支持的输入格式 SRA, FASTA, FASTQ, or FASTC 等。在NCBI上下载的SRA序列这次可以直接使用了😝。当然支持压缩格式 .gz。

输出格式支持sam, tabular, asn。

更多的其他用法这里就不在啰嗦了,请参见下面的README已经help




https://blog.sciencenet.cn/blog-1094241-1037336.html

上一篇:The pangenome of hexaploid bread wheat
下一篇:转座子可抑制mRNA翻译
收藏 IP: 58.213.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 20:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部