李雷廷的个人博客分享 http://blog.sciencenet.cn/u/llt001

博文

Kallisto: 一个RNA-seq数据快速量化软件

已有 11548 次阅读 2016-6-13 09:30 |系统分类:论文交流


(图片来源:http://dx.doi.org/10.1038/nbt.3519

2016年4月4日,Nature Biotechnology 杂志上发表了一篇题为“Near-optimal probabilistic RNA-seq quantification”的论文,主要内容是介绍一款 RNA-seq 数据量化软件 kallisto。所谓 RNA-seq 数据量化指的是从 RNA-seq 的测序数据中计算出每一个基因的表达量。传统的 RNA-seq 数据分析思路分两步,第一步是把利用 RNA-seq 方法得到的测序数据先比对到参考基因组序列上(tophat2, bowtie2, HISAT 等软件);第二步是从比对结果中计算表达量,可以理解为数每一个基因的 reads 数量(Cufflinks,HTseq-count 等软件)。

这篇论文介绍的 kallisto 软件最大的亮点在于在保证 RNA-seq 数据定量化分析与传统方法相似的精确性的基础上,极大地降低了运行时间。而这是由于在算法上更新——绕过传统方法中序列比对(alignment)的步骤,直接做量化分析。而之所以可以跳过序列比对的步骤,是基于一个已经被论证的前提,即一个read具体比对到参考基因的什么位置上不影响最终计算的表达量。这篇论文介绍的新算法着重于确定一个 read 属于哪一个基因,而不关心这个 read 在基因上的位置。

论文标题:Near-optimal probabilistic RNA-seq quantification(http://dx.doi.org/10.1038/nbt.3519)

作者:Nicolas L Bray, Harold Pimentel, Páll Melsted, Lior Pachter

摘要:

We present kallisto, an RNA-seq quantification program that is two orders of magnitude faster than previous approaches and achieves similar accuracy. Kallisto pseudoaligns reads to a reference, producing a list of transcripts that are compatible with each read while avoiding alignment of individual bases. We use kallisto to analyze 30 million unaligned paired-end RNA-seq reads in <10 min on a standard laptop computer. This removes a major computational bottleneck in RNA-seq analysis.

欢迎关注“植物基因组”微信公众号

(微信号:plant-genomes)






https://blog.sciencenet.cn/blog-656335-984247.html

上一篇:1135个拟南芥基因组测序的论文发表于Cell
下一篇:南半球海草基因组论文发表于《Plant Physiology》
收藏 IP: 218.2.227.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 20:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部