|||
使用ReSeQC做RNA-seq reads distribution时,会发现intronic占比比较多,大概30-40%,原因如下:
1,由于转录是个动态过程,期间会存在incompleted (nancant, on-going, co-transcripted,unspliced ...) spliced RNA,并且由于intron的长度一般是exon的20倍左右,所以即使有1%的incompleted spliced RNA,也会对这个分布产生较大影响。这是一个不可避免的主要原因,并且与物种、样品来源(cell, tissue, ...)等相关。
参考:
例如
pre-mrna fraction | Intronic read fraction |
1% | 16% |
2% | 28% |
5% | 49% |
2,存在genomic DNA污染,这个也是一部分原因,主要看实验过程的技术、试剂、操作等
3,基因组注释不全。这个对于研究较多的物种,一般没太大影响,不过也是一个因素。
4,其他因素:所使用的分析软件,包括比对软件,intronic reads的定义等等。
参考:
http://seqanswers.com/forums/showthread.php?t=5519 http://seqanswers.com/forums/showthread.php?t=15296Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 01:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社