不积小流 , 无以成江海 !分享 http://blog.sciencenet.cn/u/xiongchaoliang

博文

利用Tophat和Cufflinks进行RNA-Seq的数据分析流程(入门简介)

已有 10903 次阅读 2014-12-3 22:15 |个人分类:【转录组-mRNA分析】|系统分类:科研笔记

基本流程图如下图

1、主要软件及其版本

Tophat v2.0.8b、bowtie2、cufflinks v2.1.1、samtools 0.1.7、python 2.6.5、R 3.0

2、分析过程文件说明

1)tophat分析:将每组样本的reads与参考基因组进行比对

分析结果文件:accepted_hits.bam、deletions.bed、insertions.bed、junctions.bed、prep_reads.info、unmapped.bam

2)cufflinks分析:将每个样本的比对结果进行组装成转录本(transcripts)。

每一个样本的分析结果:genes.expr,transcripts.expr,transcripts.gtf

3)cuffmerge分析:按照试验设计分组将每组样本的transcripts.gtf文件合并在一起,便于基因或转录本的差异分析

每组样本的分析结果:merged.gtf

4)cuffdiff分析:比较每组样本基因表达差异,利用R语言拓展包cummeRbund进行作图分析。

安装cummeRbund过程中,可能会提示要依赖其他的R拓展包,按照安装过程中的报错提示一一安装即可。

通过cummeRbund作图,即可做出很多专业漂亮的图,基本满足发表文章的需求具体可参考其使用说明手册http://compbio.mit.edu/cummeRbund/manual.html)。



https://blog.sciencenet.cn/blog-1509670-848266.html

上一篇:使用UCSC和IGV查看reads在基因组上分布情况
下一篇:高通量测序数据的质控工具---fastx_toolkit软件使用说明
收藏 IP: 159.226.43.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 17:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部