||
RNAcentral:基因与文献整合
RNAcentral 于 2014 年建立,作为一个综合数据库,将所有非编码 RNA(ncRNA)序列整合为一个可搜索的资源。此举旨在解决非编码 RNA 领域的碎片化问题,当时存在许多专注于特定 ncRNA 亚型的优质数据库,但缺乏一个易于使用的资源来整合所有 ncRNA 数据,而 RNAcentral 正是为了填补这一空白。RNAcentral 的设计基于“专家数据库”模式,即每个贡献数据库在单一领域提供其专业知识和数据,然后 RNAcentral 将这些数据整合、标准化并整合为一个资源。自建立以来,其规模已增长至包含超过 4500 万个序列。
RNAcentral 已从提供序列和元数据发展到更复杂的数据类型,例如基因本体(GO)注释、序列本体(SO)术语、来自 IntAct和 RNA-KG等资源的相互作用数据,以及 Rfam 和 R2DT 预测等分析。RNAcentral 仍然是 ncRNA 科学的主要序列数据来源,每年拥有数万名用户和数百次引用。
自 2021 年上次发布以来,RNAcentral 已发布了 9 个版本,序列数量从 3000 万增长到 4500 万,现在包含 52 个专家数据库,其中包括 10 个新数据库以及对现有来源的重大更新。还扩展了二级结构预测,从 1300 万序列增加到 3000 万序列。除了这些数量上的变化,还更新和改进了研究人员与ncRNA 数据交互的方式。扩展了搜索功能,允许通过分类学后代进行搜索(例如,所有灵长类动物或所有真菌),并过渡到 CC0 许可,以实现无限制的数据再利用,从而支持学术和商业再利用。
最近,Andrew等人详细介绍了 RNAcentral 版本(https://rnacentral.org/)的进展:新的数据库集成和现有资源的重大更新;文献集成系统(LitScan 和 LitSumm)的实施;基因水平条目的创建;技术基础设施的改进;以及未来的发展重点。
图1 RNAcentral平台
参考文献
[1] Andrew F Green, Carlos Eduardo Ribas, Isaac Jandalala, Philippa Muston, Colman O'Cathail, Guy Cochrane, Christina Ernst, Lingyun Zhao, Pedro Madrigal, Helen Attrill, Steven Marygold, Doron Lancet, Niv Dobzinski, Patricia P Chan, Todd M Lowe, Elspeth A Bruford, Ruth L Seal, Henning Hermjakob, Kalpana Panneerselvam, Robert D Finn, Tatiana A. Gurbich, Sam Griffiths-Jones, Bastian Fromm, Kevin J Peterson, Dominik Sordyl, Janusz M Bujnicki, Sameer Velankar, Sri Devan Appasamy, Sudakshina Ganguly, Peng Zhang, Shunmin He, Kim Matthew Rutherford, Valerie Wood, Ruth Caroline Lovering, Ernesto Picardi, Nancy Ontiveros, Lin Huang, Zhichao Miao, Anton S Petrov, Holly McCann, Emanuele Cavalleri, Marco Mesiti, Elena Rivas, Marcell Szikszai, Marcin Magnus, Jan Gerken, Maria Chuvochina, Danny Bergeron, Michelle S Scott, Kelly P Williams, Mark Quinton-Tulloch, Stavros Diamantakis, Anton I Petrov, Alex Bateman, Blake Sweeney, The RNAcentral Consortium. RNAcentral in 2026: Genes and literature integration. bioRxiv 2025.09.19.677274; doi: https://doi.org/10.1101/2025.09.19.677274
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社