||
circRNA发现和分析的生物信息学工具箱
环状RNA (Circular RNA, circRNA)是一种具有生物活性的核酸分子,与信使RNA相比,它以闭环RNA形式存在,缺乏聚腺苷化的尾部。circRNA通常被归类为非编码RNA (Noncoding RNA,ncRNA),尽管一些circRNA具有蛋白质编码潜能。circRNA于20世纪70年代首次在植物类病毒中被发现和鉴定,随后在真核细胞的细胞质中被发现和鉴定。由于线性RNA占主导地位,circRNA被认为是RNA剪接的副产物,这一领域的初步进展可能缓慢。然而,下一代测序和相关生物信息学工具的最新进展加速了研究。这些分子已在许多物种中被发现,包括人类、小鼠、线虫、植物和古细菌。图1显示了描述circRNA领域发展的时间轴。
图1 circRNA研究的历史时间表。阐述了circRNA的知识、实验和计算工具的发展。蓝色、绿色和红色标记分别是与生物学、实验方法和代表性生物信息学工具相关的circRNA发现。1976年,环状RNA在植物类病毒中被电镜鉴定为环状RNA基因组。用类似的方法,1979年在真核细胞细胞质中发现环状RNA, 1986年在丁型肝炎病毒(HDV)中发现环状RNA。1991年,第一个人类circRNA被鉴定出来。1995年,circRNA在体外被证明具有蛋白质合成能力。2006年,RNase R处理被发现可以富集circRNA。到2012年,利用RNA-Seq对circRNA进行全基因组分析得到证实。2013年,circRNA被证明作为miRNA海绵,例如CDR1as和Sry。circRNAs可以稳定地与RNA结合蛋白(RBP)结合,如Argonaute蛋白(AGO)和RNA聚合酶II。2014年,Arraystar公司推出了首个商用circRNA芯片,并通过array对其表达进行了分析。2015年,circRNA被提出作为癌症生物标志物,并且可以在外泌体中检测到,circRNA也被证明是长寿的。2017年,内源性circRNA被证实可翻译成功能性多肽。2017年,研究人员开发了新的方法,通过RNase R处理,然后进行聚腺苷化和聚A+ RNA消耗(RPAD),分离高纯度的circRNA
由于最近的其他综述提供了从组织和亚细胞位置、生物发生、降解、翻译、运输、相互作用和进化保护等方面收集的证据来理解circRNA功能的观点,本次介绍的这篇综述《The bioinformatics toolbox for circRNA discovery and analysis》[1]侧重于circRNA相关的生物信息学工具。发现和分析circRNA的实验方法最近也在其他地方进行了综述。一系列研究报道了 m6A相关降解、circRNA的翻译、在癌症中的表达、融合circRNA以及在各种体液或外泌体中的表达,这些研究都指出了它们作为生物标志物的潜力。
circRNA的生物发生过程如图2所示。与线性mRNA类似,环状RNA来源于RNA聚合酶II转录的线性pre-mRNA。circRNA可以通过反向剪接产生(图2)。例如,内含子之间的内含子互补序列(ICS)配对或RNA结合蛋白(RBP)作用可以通过将远端侧背剪接外显子拉近,从而促进反向剪接,进而促进circRNA的生成。值得注意的是,一个基因可以产生不同的环状RNA,这可能受到侧翼内含子上RNA配对竞争的影响。根据circRNA最终序列中外显子和内含子的不同组合,circRNA可分为外显子circRNA、内含子circRNA和外显子-内含子circRNA。值得注意的是,外显子环状RNA可以形成单或多外显子分子。
图2 环状RNA在动物体内的生物发生过程。环状RNA形成模型:反向剪接环状化需要两端基序(Flanking AG-GU)、互补序列(ALU元件)或RBP的帮助。circRNA类型:单外显子、内含子、外显子-内含子和多外显子。circRNA功能:miRNA海绵、蛋白海绵、翻译和生物标志物
circRNA被认为具有多种功能。circRNA可以作为miRNA海绵或竞争内源性RNA (ceRNA),与其他RNA竞争性结合miRNA配对]。circRNA还可以调节细胞核内的转录,并与蛋白因子结合。与其他组织相比,circRNAs在大脑中富集。与线性RNA相比,环状RNA在组织中更稳定,寿命更长,对RNase R的抗性更强。研究表明,circRNA不仅参与多种人类疾病,包括癌症、神经退行性疾病和心血管疾病,还参与植物应激反应。
高通量测序和相关生物信息学工具和数据库的进步为促进对circRNA的理解提供了新的机会。首个全基因组circRNA图谱于2012年被描述。2013年,find_circ成为第一个公开的circRNA鉴定管道。在这篇综述中,作者们收集并分析了约100种工具,包括web服务、数据库、独立程序和管道工具,概述并讨论了这些circRNA生物信息学工具的发展趋势。 基于这些发现,作者们还讨论了circRNA分析的当前挑战和circRNA功能的临床意义。
详细综述情况见文献[1]。
参考文献
[1] Chen L, Wang C, Sun H, Wang J, Liang Y, Wang Y, Wong G. The bioinformatics toolbox for circRNA discovery and analysis. Brief Bioinform. 2021 Mar 22;22(2):1706-1728. doi: 10.1093/bib/bbaa001.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-8 07:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社