||
作者:王丽
首先发表于本实验室微信公众号:EvoDevo好好玩
生物测序技术日新月异,从最初的sanger测序到高通量illumina二代测序,以及现今炙手可热的PacBio三代测序技术,以其长读长备受科研人员青睐,面对一个样本就多达十几个G的测序数据,如何直观的看到reads在基因组的分布情况,丰度信息呢?小编今天推荐一个非常好用的可视化工具IGV,希望对大家有所帮助。
IGV,全称Intergrative Genomics Viewer,是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据,它支持各种数据,包括arrqy-based和下一代测序数据以及基因组注释文件。
在安装和配置好IGV之后,大家可以在下图所示位置选择你所感兴趣的物种基因组,IGV自带大量物种基因组,可以供大家选择,如果没有找到你所需要的物种基因组,可以在UCSC或者Ensemble上下载后,通过菜单栏中的Genomics,Load Genome From File,基因组信息如图所示。
那么怎样使用IGV观察我们的测序数据呢,IGV可以看bam,gtf格式的文件,也就是alignment file和annotation file。bam文件是sam文件的二进制格式,sam文件是生物信息学中较为常见的一种文件格式,存储reads的mapping 信息,可以通过Hisat2,BWA等比对软件产生,在加载bam文件时注意要建立Index,即后缀为.bai的索引文件,可以通过samtools实现,也可以通过菜单栏中Tools里的Run igvtools实现,具体操作如下图。在加载gtf格式的文件时操作Sort,然后通过菜单栏的File,load from file加载入IGV。
最后给大家展示一张大图,25A.bam为二代测序数据,testis.bam为三代测序数据,底部Track为Ensemble官方注释文件。我们可以在25A.bam.Coverage中直观地看到reads的丰度信息,在bam文件中看到各个基因不同的isoform及自己测序得到的不同于注释文件的isoform信息,而testis.bam则显示三代更长的reads,大家还可以自己调整感兴趣的基因组位置及比例大小。
最后给大家附上IGV下载网址http://www.igv.org/
文献链接:http://www.nature.com/nbt/journal/v29/n1/full/nbt.1754.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-24 02:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社