||
衡量基因表达量的RPKM和FPKM两种方法
RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Million)
同一个样本中基因A和基因B的相对表达量,或者不同样本中,同一个基因的相对表达量。
引入“每一千碱基(per kilobase)”的原因在于,不同的RNA可能有不同长度,长度越长,对应的reads就越多。当每个RNA都除以自身长度(以1000碱基为单位)时,就可以比较同一个样本中不同基因的相对表达量了。相似地,引入“每一百万reads”的原因是,不同的样本可能测序的深度不一样,深度越深,当然对应的reads就越多了。如果结果除以各自库的数量(以一百万reads为单位),那么我们就能很好地衡量两个不同样本中同一个基因的相对表达量。
RPKM是将Map到基因的Reads数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。
FPKM是将Map到基因的Fragments数除以Map到Genome的所有Read数(以Million为单位)与RNA的长度(以KB为单位)。
计算方法
第一步先将测序深度标准化,计算方法很简单,先分别计算出每个样本的总reads数,然后将表中数据分别除以总reads数即可,这样就得到了reads per million。
第二步是基因长度的标准化。将第一步的read per million直接除以基因长度即可。
FPKM和RPKM的定义是相同的,唯一的区别是FPKM适用于双端测序文库,而RPKM适用于单端测序文库。
TPM的不同在于它的处理顺序是不同的。即先考虑基因长度,再考虑测序深度。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-25 01:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社