zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

RNAcentral:基因与文献整合

已有 1462 次阅读 2025-10-31 17:18 |个人分类:科普|系统分类:科普集锦

RNAcentral:基因与文献整合 

RNAcentral 2014 年建立,作为一个综合数据库,将所有非编码 RNAncRNA)序列整合为一个可搜索的资源。此举旨在解决非编码 RNA 领域的碎片化问题,当时存在许多专注于特定 ncRNA 亚型的优质数据库,但缺乏一个易于使用的资源来整合所有 ncRNA 数据,而 RNAcentral 正是为了填补这一空白。RNAcentral 的设计基于专家数据库模式,即每个贡献数据库在单一领域提供其专业知识和数据,然后 RNAcentral 将这些数据整合、标准化并整合为一个资源。自建立以来,其规模已增长至包含超过 4500 万个序列。 

RNAcentral 已从提供序列和元数据发展到更复杂的数据类型,例如基因本体(GO)注释、序列本体(SO)术语、来自 IntAct RNA-KG等资源的相互作用数据,以及 Rfam R2DT 预测等分析。RNAcentral 仍然是 ncRNA 科学的主要序列数据来源,每年拥有数万名用户和数百次引用。

2021 年上次发布以来,RNAcentral 已发布了 9 个版本,序列数量从 3000 万增长到 4500 万,现在包含 52 个专家数据库,其中包括 10 个新数据库以及对现有来源的重大更新。还扩展了二级结构预测,从 1300 万序列增加到 3000 万序列。除了这些数量上的变化,还更新和改进了研究人员与ncRNA 数据交互的方式。扩展了搜索功能,允许通过分类学后代进行搜索(例如,所有灵长类动物或所有真菌),并过渡到 CC0 许可,以实现无限制的数据再利用,从而支持学术和商业再利用。 

最近,Andrew等人详细介绍了 RNAcentral 版本(https://rnacentral.org/)的进展:新的数据库集成和现有资源的重大更新;文献集成系统(LitScan LitSumm)的实施;基因水平条目的创建;技术基础设施的改进;以及未来的发展重点。 

image.png 

1 RNAcentral平台 

参考文献

[1] Andrew F Green, Carlos Eduardo Ribas, Isaac Jandalala, Philippa Muston, Colman O'Cathail, Guy Cochrane, Christina Ernst, Lingyun Zhao, Pedro Madrigal, Helen Attrill, Steven Marygold, Doron Lancet, Niv Dobzinski, Patricia P Chan, Todd M Lowe, Elspeth A Bruford, Ruth L Seal, Henning Hermjakob, Kalpana Panneerselvam, Robert D Finn, Tatiana A. Gurbich, Sam Griffiths-Jones, Bastian Fromm, Kevin J Peterson, Dominik Sordyl, Janusz M Bujnicki, Sameer Velankar, Sri Devan Appasamy, Sudakshina Ganguly, Peng Zhang, Shunmin He, Kim Matthew Rutherford, Valerie Wood, Ruth Caroline Lovering, Ernesto Picardi, Nancy Ontiveros, Lin Huang, Zhichao Miao, Anton S Petrov, Holly McCann, Emanuele Cavalleri, Marco Mesiti, Elena Rivas, Marcell Szikszai, Marcin Magnus, Jan Gerken, Maria Chuvochina, Danny Bergeron, Michelle S Scott, Kelly P Williams, Mark Quinton-Tulloch, Stavros Diamantakis, Anton I Petrov, Alex Bateman, Blake Sweeney, The RNAcentral Consortium. RNAcentral in 2026: Genes and literature integration.  bioRxiv 2025.09.19.677274; doi: https://doi.org/10.1101/2025.09.19.677274 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1508327.html

上一篇:AMICI:细胞相互作用注意力机制解释
下一篇:scHSC:通过样本对比学习增强单细胞数据聚类
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-5 18:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部