zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

miRTarBase 2025:实验验证miRNA靶标数据库升级版

已有 127 次阅读 2024-12-25 08:20 |个人分类:科普|系统分类:科普集锦

miRTarBase 2025:实验验证miRNA靶标数据库升级版

MicroRNAsmiRNAs)是一种短的非编码RNA,长度约为22个核苷酸,在调控动物、植物和真菌的生物过程中起着至关重要的作用。其调控机制包括miRNA以完全或部分互补的方式与靶标mRNA结合,导致mRNA裂解或翻译抑制,最终改变蛋白编码基因的表达。这种miRNA-靶标相互作用(miRNA-target interactionMTI)通常发生在5miRNA种子区和3端未翻译区(UTR),可能诱导mRNA的脱帽或烷基化。实验表明,miRNA调节多种生物过程,包括细胞周期、细胞发育、细胞凋亡和病理过程,如癌症进展。因此,识别MTI对于理解这些生物过程和制定解决病理条件的策略至关重要。

识别和分析MTI的需求日益增长,最近推动了许多在线资源的开发,包括数据库和功能工具。TarBase通过人工管理对实验验证的MTI进行管理,并在其最新版本中纳入病毒编码的miRNAHMDD是一个不断更新的实验支持的miRNA-疾病关联数据库,从生物医学文献中整理了包括1871miRNA2360种疾病之间的53,530种关联。miRNATissueAtlas2是另一个数据库,它从人类21种器官类型的188个组织样本中收集了miRNA图谱。TheMarker是一个最新的综合数据库,存储了各种类型的治疗和监测生物标志物,包括microRNAncRNADrug也是一个最新的数据库,主要关注与癌症耐药和潜在治疗靶点相关的非编码RNA,特别是miRNA。此外,在dbSNPGWAS CatalogClinVarCOSMIC等资源中可以找到大量与miRNA相关的单核苷酸多态性(SNP)和疾病相关变异(DRV)。

MiRNA-mRNA网络是复杂的调控系统,可以在各种生物过程中微调基因表达。这些网络在肿瘤生物学中尤其重要,它们调节肿瘤抑制因子和癌基因。例如,在非小细胞肺癌中发现的特异性miRNA-mRNA网络在疾病进展中发挥核心作用,并提供潜在的治疗靶点。miRNA通常同时靶向多个mRNA。相反,单个mRNA可以被多个miRNA调节,形成复杂网络以确保强大的基因表达控制。在癌症中,这些网络经历重编程,中心miRNA的变化有助于疾病发病机制。除了miRNA-mRNA的相互作用外,miRNA-miRNA网络(其中miRNA直接或通过共享的mRNA靶标相互调控)进一步增加了复杂性。因此,构建这些网络将为miRNA研究增加一层有价值的信息,特别是在疾病背景下。

大型语言模型(LLM)可以生成类似人类的文本响应,而不需要特定任务的训练。这种能力允许LLM直接应用于miRNA文本挖掘,以提取有关MTImiRNA -疾病关联的相关句子,以及miRNA和目标/疾病实体,而不需要大量训练数据。这是传统自然语言处理(NLP)模型(如BERT)的关键优势。ChatGPT是最著名的LLM,但它的计算成本很高,而且不是开源的。相比之下,METALLAMA是一个参数少得多的开源LLM,提供与ChatGPT相当的性能。这使得研究人员更容易使用LLAMA,使他们能够在他们的计算环境中对模型进行本地化,并大规模处理生物医学文档。

最近的研究强调了氧化应激对miRNA功能的显著影响。活性氧(ROS)可以诱导miRNA序列的氧化修饰,导致碱基配对改变和目标识别的变化。这种修饰可以导致miRNA与未修饰状态下不同的mRNA靶标结合,潜在地改变下游基因表达和调控通路。这些变化可能导致不同的生物学结果,特别是在氧化应激条件下,关键基因的调控可能受到显著影响。了解这些氧化修饰对于理解miRNA介导的基因调控全谱是至关重要的,特别是在氧化应激普遍存在的疾病背景下。

miRTarBase是一个人工管理的数据库,包含经过实验验证的MTI,自2011年推出以来已经更新了10次。这一次,miRTarBase扩展了其范围,构建了与疾病相关的miRNA调控网络,并纳入了miRNA生物标志物、耐药性、小分子对miRNA表达的影响和miRNA氧化的数据,从而提供了比TarBase等同类数据库更丰富、多维的资源。在这个最新版本中,miRTarBase集成了来自13,690篇研究文章的3,817,550个经过验证的MTI,反映了数据的显著扩展和改进的过程。为了帮助MTI的人工管理,该版本将LLAMA3模型纳入其NLP管道,这使得从广泛的生物医学文档中识别MTImiRNA-疾病之间的关联,而不需要大型训练数据集。关于miRNA与治疗药物相互作用的新数据,包括它们在耐药性中的作用已经被添加,为治疗策略提供了重要的见解。此外,此次更新强调了miRNA作为预测性、安全性和监测生物标志物的潜力,用于评估毒性、指导临床治疗和优化治疗结果。此外,此次更新的特点是miRNA-mRNAmiRNA-miRNA调控网络,能够识别关键调控节点和共调控miRNA,这提供了对miRNA功能的更深入了解,并突出了关键靶基因,为治疗靶点发现和生物标志物鉴定开辟了新的途径。值得注意的是,这一更新还包括氧化miRNA序列的收集,进一步扩展了我们对氧化修饰如何改变miRNA靶向和调控的理解。重新设计的用户界面和架构也增强了可用性和数据可访问性,使miRTarBase成为研究人员在分子肿瘤学、毒理学和药物开发等领域研究miRNA相关过程的宝贵工具。

  image.png 

1 miRTarBase更新元素。作为关于MTI的最全面的资源,本次更新累积了50,817,550个有实验证据支持的手工确认的MTI

2011年推出以来,miRTarBase已发展成为实验验证MTI的领先资源。将LLAMA3模型整合到NLP管道中,极大地促进了miRNA-靶标和miRNA-疾病关联的管理,并提高了整体数据的完整性。该平台具有更友好的用户界面和可访问性,并重新设计了完整的网络界面,包括miRNA-药物关联和生物标志物信息等新功能。此外,高通量验证MTI的扩展,包括CLIP-seqPAR-CLIP数据集,丰富了数据库在疾病和治疗背景下研究miRNA调控的实用性。在未来,miRTarBase将继续扩展和整合先进技术,确保它仍然是研究人员在疾病诊断、治疗开发等方面研究miRNA相关过程的重要资源。

参考文献

[1] Cui S, Yu S, Huang HY, Lin YC, Huang Y, Zhang B, Xiao J, Zuo H, Wang J, Li Z, Li G, Ma J, Chen B, Zhang H, Fu J, Wang L, Huang HD. miRTarBase 2025: updates to the collection of experimentally validated microRNA-target interactions. Nucleic Acids Res. 2024 Nov 23:gkae1072. doi: 10.1093/nar/gkae1072.

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1465897.html

上一篇:DIISCO:时间序列单细胞数据中推断动态细胞互作
收藏 IP: 112.116.155.*| 热度|

1 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-26 00:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部