Chen Lab @ HZAU分享 http://blog.sciencenet.cn/u/chenzhenxia119

博文

【生信技能】测序数据可视化

已有 4242 次阅读 2018-7-17 17:23 |个人分类:学习经验|系统分类:科研笔记

作者:王丽 

首先发表于本实验室微信公众号:EvoDevo好好玩


生物测序技术日新月异,从最初的sanger测序到高通量illumina二代测序,以及现今炙手可热的PacBio三代测序技术,以其长读长备受科研人员青睐,面对一个样本就多达十几个G的测序数据,如何直观的看到reads在基因组的分布情况,丰度信息呢?小编今天推荐一个非常好用的可视化工具IGV,希望对大家有所帮助。

IGV,全称Intergrative Genomics Viewer,是一种高性能的可视化工具,用来交互式地探索大型综合基因组数据,它支持各种数据,包括arrqy-based和下一代测序数据以及基因组注释文件。

在安装和配置好IGV之后,大家可以在下图所示位置选择你所感兴趣的物种基因组,IGV自带大量物种基因组,可以供大家选择,如果没有找到你所需要的物种基因组,可以在UCSC或者Ensemble上下载后,通过菜单栏中的Genomics,Load Genome From File,基因组信息如图所示。

那么怎样使用IGV观察我们的测序数据呢,IGV可以看bam,gtf格式的文件,也就是alignment file和annotation file。bam文件是sam文件的二进制格式,sam文件是生物信息学中较为常见的一种文件格式,存储reads的mapping 信息,可以通过Hisat2,BWA等比对软件产生,在加载bam文件时注意要建立Index,即后缀为.bai的索引文件,可以通过samtools实现,也可以通过菜单栏中Tools里的Run igvtools实现,具体操作如下图。在加载gtf格式的文件时操作Sort,然后通过菜单栏的File,load from file加载入IGV。

最后给大家展示一张大图,25A.bam为二代测序数据,testis.bam为三代测序数据,底部Track为Ensemble官方注释文件。我们可以在25A.bam.Coverage中直观地看到reads的丰度信息,在bam文件中看到各个基因不同的isoform及自己测序得到的不同于注释文件的isoform信息,而testis.bam则显示三代更长的reads,大家还可以自己调整感兴趣的基因组位置及比例大小。

最后给大家附上IGV下载网址http://www.igv.org/

文献链接:http://www.nature.com/nbt/journal/v29/n1/full/nbt.1754.html



https://blog.sciencenet.cn/blog-355779-1124537.html

上一篇:【生信技能】用 Adobe Illustrator CS6 美颜科学作图
下一篇:华中农大2018年生物信息学暑期班顺利举办
收藏 IP: 220.249.99.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-24 02:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部