||
miREA:基于网络miRNA定向富集分析
微小RNA(miRNA)是一类小非编码 RNA,已被证明参与多种生物学过程和疾病进展。具体而言,它们通过与靶标 mRNA 中的互补序列结合,在转录后水平上调控基因表达,主要通过翻译抑制或 mRNA 降解发挥作用。揭示 miRNA 的功能作用对于理解其调控机制和发现潜在治疗靶点至关重要。单个 miRNA 可以调控参与多种细胞功能的众多转录本,而单个 mRNA 也可能被多个 miRNA 靶向。这种复杂的多对多的调控关系使得差异 miRNA 表达的解读变得复杂,并给单个 miRNA 在细胞过程中的功能注释带来挑战。此外,高通量测序技术的发展产生了大量数据,使得计算方法对于大规模 miRNA 数据集的系统分析变得不可或缺。 因此,为研究界开发一款用于分析 miRNA 测序数据的通用工具颇具吸引力。
富集分析已被广泛应用于总结基因水平或 miRNA 水平的表达谱,以获得通路水平的生物学见解。通路代表一个功能分子集,共同调控特定的生物过程或细胞功能。根据所使用的数据和底层算法,基因集富集分析可以大致分为四大类,包括ORA分析、基于评分的分析、通路拓扑分析和网络分析。传统的 miRNA 富集分析要么是基因中心法,要么是 miRNA 中心法。基因中心法识别感兴趣 miRNA(例如,某种生物学条件下差异表达的 miRNA)靶向的基因,并对这些 miRNA 靶基因进行超几何检验,以确定它们在相关通路中的富集。相比之下,miRNA 中心法通过以下两种方式推断 miRNA 相关通路:一是从与某些疾病和功能相关的 miRNA 集合中推断,二是将基因相关通路转化为 miRNA 集合,这些 miRNA 集合至少靶向通路中的一个基因。这些方法可以统称为基于节点的分析方法,其中最具代表性的是 miEAA和 miRNet,它们通过交互式网络界面提供以基因为中心和以 miRNA 为中心的分析。然而,基于节点的分析方法通过将 miRNA 与其靶点的关联视为二元关系,并忽略 miRNA-基因相互作用(MGI)的调控特征(例如忽视 miRNA 与其靶基因的结合特性以及它们之间的调控强度),从而引入了偏差,进而削弱了通路中基因调控网络的拓扑属性。相比之下,基于边的富集分析方法通过考虑 MGI 中的调控信息,为分析赋予了基因调控网络中更准确的调控和拓扑信息。具体而言,差异共表达分析已被用于识别失调的通路基因集。 Han等人通过基于基因-基因相互作用差异相关性分析的边集富集分析,在基因表达数据背景下研究了失调通路。DysPIA 通过基于双样本 Welch t 检验的失调基因对量化,执行配对基因富集分析。然而,这些方法仅专注于蛋白质编码基因,并且严重依赖表达谱而非调控信息。这限制了它们捕捉调控见解的能力,并使它们对转录组数据的变异性敏感。此外,基于表达的边分析提供了有限的机制可解释性,这对于理解 miRNA 的作用至关重要,因为它们的功能主要由其相互作用的靶基因决定。这些局限性突出了需要一种以边为导向的富集分析方法,该方法整合可靠的 MGI 景观、定量的相互作用信息和经过整理的通路网络,以系统地分析 miRNA 的功能。
最近,Zhang等人开发了一个基于网络的 miRNA 定向富集分析工具(miREA,图1,https://github.com/laixn/miREA),该工具在边缘层面测量 miRNA,以表征与生物通路相关的 miRNA 调控功能。通过关注 MGI(miRNA 基因相互作用)而非单个 miRNA 或基因,miREA 解决了 MGI 固有的多对多调控作用,并减少了以节点为中心的富集方法引入的偏差,其中 MGI 分数被提出用于测量和区分 MGI 的调控强度。miREA 将 miRNA 和基因表达谱与包括 MGI 和基因-基因相互作用(GGI)在内的经过整理的基因调控网络相结合,并实现了五种基于边缘的算法,即过表达、基于评分、拓扑感知和网络传播方法。通过对 17 种癌症类型的传统方法进行对比分析,展示了基于边缘的算法在表征 miRNA 功能方面的优越性。这是通过更好的指标值来证明的,包括生物学相关通路敏感性、特异性、区分癌症特异性通路的能力、在识别与癌症相关的 miRNA 和基因方面的生物学可解释性、对输入数据变异和预设阈值的鲁棒性、整合数据源的影响以及使用并行计算的计算效率。此外,miREA 集成了不同的可视化模块,以促进方法选择和研究 miRNA-基因-通路调控机制。这通过膀胱癌的案例研究得到展示。总而言之,miREA 是一个用于在通路水平上分析 miRNA 细胞功能的通用计算框架,为癌症等人类疾病中的 miRNA 介导的基因调控提供了机制见解。

图1 基于边缘的五种富集分析方法概述。Edge-ORA对感兴趣的MGI列表应用超几何检验,从公共数据库或通路中识别富集的基因集。Edge-Network通过使用RWR算法和置换检验考虑通路网络拓扑来扩展框架。此外,考虑了MGI中的定量信息,并开发了三种方法。Edge-2Ddist考虑了MGI中的两种信息,包括miRNA与其靶基因之间的相关性和相对表达变化率。Edge-Score将这两部分信息转化为一个MGI分数。基于MGI分数,Edge-Topology进一步结合了通路网络结构。每个部分展示了一种基于边缘的方法,而中间的箭头和文本则表示不同方法之间引入的渐进信息。三角形和圆圈分别代表miRNA和基因。箭头表示调控方向,实线表示MGI,虚线表示GGI。在Edge-2Ddist中,正方形代表MGI。例如,通路A包含七个MGI,其中两个是DEMGI,和六个GGI。通路A中涉及的MGI用绿色阴影或箭头突出显示。类似地,Edge-Network中的通路B和通路C分别用蓝色和黄色阴影描绘。DEMGI用粉色阴影和粉色箭头表示。通过带有黄到红渐变的箭头可视化MGI分数,表示从正分数到负分数的过渡。富集分数(ES)是曲线从零点的最大负偏差
参考文献
[1] Zhesi Zhang, Xin Lai. miREA: a network-based tool for microRNA-oriented enrichment analysis. bioRxiv 2026.02.27.708509; doi: https://doi.org/10.64898/2026.02.27.708509
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-29 16:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社