zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

circMine:整合、分析和可视化人类疾病circRNA转录组的综合数据库

已有 611 次阅读 2023-11-24 07:22 |个人分类:科普|系统分类:科普集锦

circMine:整合、分析和可视化人类疾病circRNA转录组的综合数据库 

环状RNA (circRNA)是真核生物中由前体信使RNA (mRNA)反向剪接产生的共价封闭内源性RNA,它们主要是通过深度测序技术发现的。研究表明,circRNAs通过充当microRNA (miRNA)海绵、竞争内源性RNA (ceRNA)、蛋白质调节剂,甚至通过自身翻译产生多肽和蛋白质,在重要的生物过程中发挥关键作用。它们正在成为人类疾病的一种新型生物标志物。尽管在过去的十年中对circRNA的研究正在迅速积累,但我们对其在人类疾病中的临床和生物学意义的了解仍然难以捉摸。 

已经开发了数据库和计算工具,用于鉴定和注释转录的circRNA、组织和细胞类型特异性circRNAcircRNA相互作用因子(miRNA和蛋白质)、潜在可翻译的circRNA和实验验证的疾病相关circRNA。例如,circBaseCircBankcircAtlas数据库为circRNA提供了全面的基因组学和功能注释。CSCDCircRiC被设计来注释癌症特异性circRNAs。此外,开发了exoRBase,以提供来自RNA-seq数据分析的人类血液外泌体环状RNA的景观。最近,Li等人设计了riboCIRC从特异性宿主和研究核糖体测序数据分析中可翻译的环状RNA。然而,目前缺乏数据库来整合人类疾病circRNA转录组数据集,并提供全面的分析来在线调查这些宝贵的数据集,以识别和发现circRNA的临床和生物学意义。

在过去的5年中,大量的人类circRNA转录组数据被生成并存储在Gene Expression Omnibus (GEO)中。然而,对于没有生物信息学技能的研究人员来说,调查这些宝贵的数据或自己的数据是非常具有挑战性的,并且也很难从GEO的大量数据中找到具有指定生理和病理条件的特定circRNA数据。此外,GEO中不同高通量平台生成的circRNA转录组数据存在较大的异质性,进一步阻碍了应用。因此,迫切需要设计一个特定的数据库平台,能够整合并提供全面的分析功能来研究circRNA转录组数据,从而促进circRNA在人类疾病中的研究和理解。 

为了克服以上这些挑战,Zhang等人专门设计了circMine (http://www.biomedical-web.com/circmine)来整合来自GEO的人类circRNA转录组数据,并开发了全面的web应用程序来调查这些数据(1)。目前,circMine提供了1,821,448个条目,由136,871circRNA组成,87种疾病和120circRNA转录组数据集,涵盖31个人体位点的1107个样本。为了消除数据异质性,每个数据集都被标准化,并手工标注了特定的生理和病理条件,以便准确地检索数据(1A)。此外,为了发现和鉴定人类疾病中重要的环状RNA,开发了13种不同的分析功能来单独研究综合数据(1B,左上面板)circMine上的Web Server应用程序进一步为研究人员提供了对他们自己的circRNA转录组数据进行13项分析的机会(1B,左上面板) 

image.png

1 数据采集和人工管理方案(A)circMineweb应用框架(B)

此外,circMine还提供了另外三种工具来发现和鉴定circRNA的生物学意义,包括circRNA-miRNA预测、circRNA IRES预测和ribo-circRNA定位(1B,左下面板)。此外,circMine提供了用户友好的web界面,可以公开浏览、搜索、下载数据,并提交新的circRNA转录组数据进行进一步整合(1B,右图)。综上所述,circMine可以显著提高我们发现和识别circRNA在人类疾病中的意义的洞察力。 

参考文献

[1] Zhang W, Liu Y, Min Z, Liang G, Mo J, Ju Z, Zeng B, Guan W, Zhang Y, Chen J, Zhang Q, Li H, Zeng C, Wei Y, Chan GC. circMine: a comprehensive database to integrate, analyze and visualize human disease-related circRNA transcriptome. Nucleic Acids Res. 2022 Jan 7;50(D1):D83-D92. doi: 10.1093/nar/gkab809. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

 

image.png




https://blog.sciencenet.cn/blog-571917-1410908.html

上一篇:CancerProteome:破译癌症中蛋白质组景观资源
下一篇:RNA研究的最新前沿
收藏 IP: 39.128.54.*| 热度|

1 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-2-26 15:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部