||
circMine:整合、分析和可视化人类疾病circRNA转录组的综合数据库
环状RNA (circRNA)是真核生物中由前体信使RNA (mRNA)反向剪接产生的共价封闭内源性RNA,它们主要是通过深度测序技术发现的。研究表明,circRNAs通过充当microRNA (miRNA)海绵、竞争内源性RNA (ceRNA)、蛋白质调节剂,甚至通过自身翻译产生多肽和蛋白质,在重要的生物过程中发挥关键作用。它们正在成为人类疾病的一种新型生物标志物。尽管在过去的十年中对circRNA的研究正在迅速积累,但我们对其在人类疾病中的临床和生物学意义的了解仍然难以捉摸。
已经开发了数据库和计算工具,用于鉴定和注释转录的circRNA、组织和细胞类型特异性circRNA、circRNA相互作用因子(如miRNA和蛋白质)、潜在可翻译的circRNA和实验验证的疾病相关circRNA。例如,circBase、CircBank和circAtlas数据库为circRNA提供了全面的基因组学和功能注释。CSCD和CircRiC被设计来注释癌症特异性circRNAs。此外,开发了exoRBase,以提供来自RNA-seq数据分析的人类血液外泌体环状RNA的景观。最近,Li等人设计了riboCIRC从特异性宿主和研究核糖体测序数据分析中可翻译的环状RNA。然而,目前缺乏数据库来整合人类疾病circRNA转录组数据集,并提供全面的分析来在线调查这些宝贵的数据集,以识别和发现circRNA的临床和生物学意义。
在过去的5年中,大量的人类circRNA转录组数据被生成并存储在Gene Expression Omnibus (GEO)中。然而,对于没有生物信息学技能的研究人员来说,调查这些宝贵的数据或自己的数据是非常具有挑战性的,并且也很难从GEO的大量数据中找到具有指定生理和病理条件的特定circRNA数据。此外,GEO中不同高通量平台生成的circRNA转录组数据存在较大的异质性,进一步阻碍了应用。因此,迫切需要设计一个特定的数据库平台,能够整合并提供全面的分析功能来研究circRNA转录组数据,从而促进circRNA在人类疾病中的研究和理解。
为了克服以上这些挑战,Zhang等人专门设计了circMine (http://www.biomedical-web.com/circmine)来整合来自GEO的人类circRNA转录组数据,并开发了全面的web应用程序来调查这些数据(图1)。目前,circMine提供了1,821,448个条目,由136,871个circRNA组成,87种疾病和120个circRNA转录组数据集,涵盖31个人体位点的1107个样本。为了消除数据异质性,每个数据集都被标准化,并手工标注了特定的生理和病理条件,以便准确地检索数据(图1A)。此外,为了发现和鉴定人类疾病中重要的环状RNA,开发了13种不同的分析功能来单独研究综合数据(图1B,左上面板)。circMine上的Web Server应用程序进一步为研究人员提供了对他们自己的circRNA转录组数据进行13项分析的机会(图1B,左上面板)。
图1 数据采集和人工管理方案(A)和circMine的web应用框架(B)
此外,circMine还提供了另外三种工具来发现和鉴定circRNA的生物学意义,包括circRNA-miRNA预测、circRNA IRES预测和ribo-circRNA定位(图1B,左下面板)。此外,circMine提供了用户友好的web界面,可以公开浏览、搜索、下载数据,并提交新的circRNA转录组数据进行进一步整合(图1B,右图)。综上所述,circMine可以显著提高我们发现和识别circRNA在人类疾病中的意义的洞察力。
参考文献
[1] Zhang W, Liu Y, Min Z, Liang G, Mo J, Ju Z, Zeng B, Guan W, Zhang Y, Chen J, Zhang Q, Li H, Zeng C, Wei Y, Chan GC. circMine: a comprehensive database to integrate, analyze and visualize human disease-related circRNA transcriptome. Nucleic Acids Res. 2022 Jan 7;50(D1):D83-D92. doi: 10.1093/nar/gkab809.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 06:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社