zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

miREA:基于网络miRNA定向富集分析

已有 169 次阅读 2026-3-29 12:05 |个人分类:科普|系统分类:科普集锦

miREA:基于网络miRNA定向富集分析 

微小RNAmiRNA)是一类小非编码 RNA,已被证明参与多种生物学过程和疾病进展。具体而言,它们通过与靶标 mRNA 中的互补序列结合,在转录后水平上调控基因表达,主要通过翻译抑制或 mRNA 降解发挥作用。揭示 miRNA 的功能作用对于理解其调控机制和发现潜在治疗靶点至关重要。单个 miRNA 可以调控参与多种细胞功能的众多转录本,而单个 mRNA 也可能被多个 miRNA 靶向。这种复杂的多对多的调控关系使得差异 miRNA 表达的解读变得复杂,并给单个 miRNA 在细胞过程中的功能注释带来挑战。此外,高通量测序技术的发展产生了大量数据,使得计算方法对于大规模 miRNA 数据集的系统分析变得不可或缺。 因此,为研究界开发一款用于分析 miRNA 测序数据的通用工具颇具吸引力。 

富集分析已被广泛应用于总结基因水平或 miRNA 水平的表达谱,以获得通路水平的生物学见解。通路代表一个功能分子集,共同调控特定的生物过程或细胞功能。根据所使用的数据和底层算法,基因集富集分析可以大致分为四大类,包括ORA分析、基于评分的分析、通路拓扑分析和网络分析。传统的 miRNA 富集分析要么是基因中心法,要么是 miRNA 中心法。基因中心法识别感兴趣 miRNA(例如,某种生物学条件下差异表达的 miRNA)靶向的基因,并对这些 miRNA 靶基因进行超几何检验,以确定它们在相关通路中的富集。相比之下,miRNA 中心法通过以下两种方式推断 miRNA 相关通路:一是从与某些疾病和功能相关的 miRNA 集合中推断,二是将基因相关通路转化为 miRNA 集合,这些 miRNA 集合至少靶向通路中的一个基因。这些方法可以统称为基于节点的分析方法,其中最具代表性的是 miEAA miRNet,它们通过交互式网络界面提供以基因为中心和以 miRNA 为中心的分析。然而,基于节点的分析方法通过将 miRNA 与其靶点的关联视为二元关系,并忽略 miRNA-基因相互作用(MGI)的调控特征(例如忽视 miRNA 与其靶基因的结合特性以及它们之间的调控强度),从而引入了偏差,进而削弱了通路中基因调控网络的拓扑属性。相比之下,基于边的富集分析方法通过考虑 MGI 中的调控信息,为分析赋予了基因调控网络中更准确的调控和拓扑信息。具体而言,差异共表达分析已被用于识别失调的通路基因集。 Han等人通过基于基因-基因相互作用差异相关性分析的边集富集分析,在基因表达数据背景下研究了失调通路。DysPIA 通过基于双样本 Welch t 检验的失调基因对量化,执行配对基因富集分析。然而,这些方法仅专注于蛋白质编码基因,并且严重依赖表达谱而非调控信息。这限制了它们捕捉调控见解的能力,并使它们对转录组数据的变异性敏感。此外,基于表达的边分析提供了有限的机制可解释性,这对于理解 miRNA 的作用至关重要,因为它们的功能主要由其相互作用的靶基因决定。这些局限性突出了需要一种以边为导向的富集分析方法,该方法整合可靠的 MGI 景观、定量的相互作用信息和经过整理的通路网络,以系统地分析 miRNA 的功能。 

最近,Zhang等人开发了一个基于网络的 miRNA 定向富集分析工具(miREA,图1https://github.com/laixn/miREA),该工具在边缘层面测量 miRNA,以表征与生物通路相关的 miRNA 调控功能。通过关注 MGImiRNA 基因相互作用)而非单个 miRNA 或基因,miREA 解决了 MGI 固有的多对多调控作用,并减少了以节点为中心的富集方法引入的偏差,其中 MGI 分数被提出用于测量和区分 MGI 的调控强度。miREA miRNA 和基因表达谱与包括 MGI 和基因-基因相互作用(GGI)在内的经过整理的基因调控网络相结合,并实现了五种基于边缘的算法,即过表达、基于评分、拓扑感知和网络传播方法。通过对 17 种癌症类型的传统方法进行对比分析,展示了基于边缘的算法在表征 miRNA 功能方面的优越性。这是通过更好的指标值来证明的,包括生物学相关通路敏感性、特异性、区分癌症特异性通路的能力、在识别与癌症相关的 miRNA 和基因方面的生物学可解释性、对输入数据变异和预设阈值的鲁棒性、整合数据源的影响以及使用并行计算的计算效率。此外,miREA 集成了不同的可视化模块,以促进方法选择和研究 miRNA-基因-通路调控机制。这通过膀胱癌的案例研究得到展示。总而言之,miREA 是一个用于在通路水平上分析 miRNA 细胞功能的通用计算框架,为癌症等人类疾病中的 miRNA 介导的基因调控提供了机制见解。 

image.png

1 基于边缘的五种富集分析方法概述。Edge-ORA对感兴趣的MGI列表应用超几何检验,从公共数据库或通路中识别富集的基因集。Edge-Network通过使用RWR算法和置换检验考虑通路网络拓扑来扩展框架。此外,考虑了MGI中的定量信息,并开发了三种方法。Edge-2Ddist考虑了MGI中的两种信息,包括miRNA与其靶基因之间的相关性和相对表达变化率。Edge-Score将这两部分信息转化为一个MGI分数。基于MGI分数,Edge-Topology进一步结合了通路网络结构。每个部分展示了一种基于边缘的方法,而中间的箭头和文本则表示不同方法之间引入的渐进信息。三角形和圆圈分别代表miRNA和基因。箭头表示调控方向,实线表示MGI,虚线表示GGI。在Edge-2Ddist中,正方形代表MGI。例如,通路A包含七个MGI,其中两个是DEMGI,和六个GGI。通路A中涉及的MGI用绿色阴影或箭头突出显示。类似地,Edge-Network中的通路B和通路C分别用蓝色和黄色阴影描绘。DEMGI用粉色阴影和粉色箭头表示。通过带有黄到红渐变的箭头可视化MGI分数,表示从正分数到负分数的过渡。富集分数(ES)是曲线从零点的最大负偏差 

参考文献

[1] Zhesi Zhang, Xin Lai. miREA: a network-based tool for microRNA-oriented enrichment analysis. bioRxiv 2026.02.27.708509; doi: https://doi.org/10.64898/2026.02.27.708509 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

42. CircTarget:多种细胞类型circRNA调控综合数据库

43. GreenCells:植物lncRNA单细胞分析资源

44. RM2Target 2.0RNA修饰的写入者、擦除者和读取者靶基因数据库

45. SDMap:空间药物扰动图谱数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1527858.html

上一篇:利用孪生信息进行基因调控网络推断
下一篇:TFBSpedia:人类和小鼠转录因子结合位点数据库
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-3-29 16:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部