luria的个人博客分享 http://blog.sciencenet.cn/u/luria

博文

宏基因组Binning软件MetaBat2的安装与使用

已有 564 次阅读 2019-10-17 18:20 |个人分类:Metagenomics|系统分类:科研笔记| 宏基因组, 分箱, 聚类, MetaBat, binning

1. MetaBat2的安装

MetaBat2引文[1]提供的下载地址,从以下路径下载到最新版本的MetaBat2

https://bitbucket.org/berkeleylab/metabat/downloads/

 

mkdir metabat2 & cd metabat2

wget https://bitbucket.org/berkeleylab/metabat/downloads/metabat-static-binary-linux-x64_v2.12.1.tar.gz

 

tar -zxvf  metabat-static-binary-linux-x64_v2.12.1.tar.gz

#下载后解压即可使用,主程序为runMetaBat.sh


 

2. MetaBat2的使用

MetaBat2的输入为组装的contig序列以及将二代reads比对到contig序列上的比对文件(bam格式)

比对可以采用BWABowtie2,以Bowtie2为例进行比对,Bowtie2的安装可参见之前写的博文:Bowtie2Samtools软件更新

/path/to/bowtie2-build --threads 30 assembly_contig.fasta assembly_contig

/path/to/bowtie2 --threads 30 -x assembly_contig -1 /path/to/wgs_reads_R1.fastq.gz -2 /path/to/wgs_reads_R2.fastq.gz | samtools sort --threads 30 -o sample.sort.bam -

# 其中assembly_contig.fasta是宏基因组组装软件组装出的结果;wgs_reads_R1.fastq.gzwgs_reads_R2.fastq.gz是二代数据reads

 

比对完生成sample.sort.bam文件,再采用MetaBat2Binning

sh /path/to/runMetaBat.sh /path/to/assembly_contig.fasta  /path/to/ sample.sort.bam

运行完会生成assembly_contig.fasta.metabat-bins目录

 

3. 评估

这是这篇博文的重点!

本博文采用的测试数据来自材料[2],文章中既测了二代WGS数据,也测了HiC数据,我们可以采用HiC数据可视化地查看聚类结果如何。通过比对后可视化结果如下:


图中一个蓝色框表示聚的一个类。结果显示有一些类结果比较好,如4-7个蓝色框(Cluster);也有一些聚类结果不好,如1-3个蓝色框(Cluster)

 

上述图中我们发现不同Cluster的颜色深浅不同,而互作图中颜色深浅可以评估出互作强度。那么很自然,会再去查看一下二代WGS数据比对到每个Clustercontigs上,Cluster的平均深度如何?

结果如下,除第7Cluster测序深度不同外,其它几个Cluster差异并不大


参考文献

[1] Dongwan D. Kang, Feng Li, Edward Kirton, et al. MetaBAT2: an adaptive binning algorithm for robust and efficient genome reconstruction from metagenome assemblies. 2019. Peerj.

[2] Joshua N. Burton, Ivan Liachko, Maitreya J. Dunham, et al. Species-Level Deconvolution of Metagenome Assemblies with Hi-C Based Contact Probability Maps. 2014. G3



http://blog.sciencenet.cn/blog-2970729-1202341.html

上一篇:HiCPro接CscoreTools检测Compartment

1 张叔勇

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-11-14 17:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部