||
生物信息学在非编码RNA分析中的作用
在细胞或组织中出现的一组RNA分子被称为转录组。事实上,超过90%的人类基因组都经历了转录,但这种活性的一小部分与编码蛋白质的基因有关,这些基因占总转录的不到2% 。因此,大多数转录基因产生非编码RNA (ncRNA)。
非编码RNA (ncRNA)这个术语通常用来描述不携带蛋白质合成指令的RNA分子。然而,这并不意味着这些RNA缺乏功能或信息。最近的研究挑战了传统的观点,即蛋白质编码基因只负责遗传信息的处理。研究表明,哺乳动物和其他复杂生物体基因组的很大一部分被转录成ncRNA。这些ncRNA可以进行选择性剪接和加工,从而产生更小的RNA分子。此外,还有许多较长的转录本,其特征是正链和反义链重叠和交错的复杂模式,其中大多数具有未知的功能。
在这些包括源自内含子的ncRNA中,存在一个隐藏的内部信号网络,在生理过程和发育过程中对基因表达的不同方面施加影响。这些ncRNA在调节染色质结构、维持表观遗传信息、控制转录、RNA剪接、RNA编辑、RNA降解和翻译等方面发挥着至关重要的作用。由这些RNA分子形成的错综复杂的网络可能在决定复杂特征方面发挥了必要的作用,它们也可能对疾病过程有所贡献。探索RNA调控网络的广阔景观对于理解形成各种生物过程和疾病的潜在机制是必要的。
ncRNA可以根据其功能大致分为两组:调控和管家ncRNA。它们在不同水平的基因调控中发挥作用,包括mRNA加工、转录、翻译和染色质修饰。调控ncRNA包含多种类型的分子,如长链非编码RNA (lncRNA)、微小RNA (miRNA)和小干扰RNA (siRNA)等。这些ncRNA可以影响基因表达。
lncRNA越来越被认为是基因表达网络的重要调节因子,其大小和形状各异。真核生物基因组产生不同种类的lncRNA,转录自不同的DNA区域,包括增强子、启动子和基因间区域。一些lncRNA起源于冗长的初级转录本,通过非常规的RNA加工途径,导致产生具有意想不到结构的新RNA物种。这些lncRNA可以经历不同的加工机制,如核糖核酸酶P (RNase P)裂解,产生成熟的3 '端,并通过其末端的小核核RNA (snoRNA) -蛋白(snoRNP)复合物盖上,或形成环状结构。
通过复杂的机制,lncRNA在基因表达、基因组印迹、剂量补偿、核组织和核胞质运输等方面发挥着至关重要的作用。lncRNA与疾病的关联及其在各种组织中的独特表达模式表明,它们是转录调控回路的基本组成部分。lncRNA的特定结构和序列特征介导了它们的功能。它们可以与细胞质和细胞核中的RNA、DNA和蛋白质相互作用,通过这些相互作用发挥调控作用。
2003年,人类基因组计划(HGP)完成后,进一步探索非编码区及其在传统基因定义中的意义成为必要。2003年开始的DNA元素百科全书(ENCODE)项目发现,大约80%的人类基因组具有生化功能。在这个功能部分中,76%的DNA被转录成RNA,其中约2%的转录RNA被表达为功能蛋白。估计有20,000个蛋白质编码基因与在哺乳动物转录组中鉴定的超过100,000个不同转录本之间的巨大差异表明,有可能发现一类新的非翻译RNA。
非编码RNA (ncRNA)主要分为两类:管家ncRNA和调控ncRNA。此外,调控ncRNA的分类是根据它们的大小进行的,其中少于200个核苷酸的ncRNA被称为小ncRNA,而超过这个阈值的ncRNA被称为lncRNA。小ncRNA类别包括miRNA, piwi相互作用RNA (piRNA)和siRNA。图1给出了ncRNA (rRNA、tRNA、miRNA、siRNA、piRNA、circRNA、snoRNA、shRNA和lncRNA)的结构分类示意图。
图1 不同非编码RNA (ncRNA)及其结构示意图,包括核糖体RNA (rRNA)、转移RNA (tRNA)、长链非编码RNA (lncRNA)、微小RNA (miRNA)、环状RNA (circRNA)、小核仁RNA (snoRNA)、短发夹RNA (shRNA)和piwi相互作用RNA (piRNA)
生物信息学在ncRNA研究中的应用突出了计算方法如何在预测和鉴定新型ncRNA、靶基因预测、RNA结构预测、进化分析、功能预测和调控网络构建方面做出贡献。最近出版的《Advances in Bioinformatics》的章节内容《Role of Bioinformatics in Non-coding RNA Analysis》简要讨论了有助于分析和解释ncRNA数据的数据库和工具,包括LncTarD、LnCeVar、MirGeneDB、miRTarBase、SEAweb、DIANA-LncBase、miRPathDB、RNAInter、oRNAment、miRDB、ENCORI、NPInter等。这些资源提供了有关ncRNA相互作用、靶标、功能和调控的宝贵信息,使研究人员能够探索复杂的ncRNA世界。
参考文献
[1] Mathuria, A., Mehak, Mani, I. (2024). Role of Bioinformatics in Non-coding RNA Analysis. In: Singh, V., Kumar, A. (eds) Advances in Bioinformatics. Springer, Singapore. https://doi.org/10.1007/978-981-99-8401-5_5
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 10:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社