||
PRISM-GRN:单细胞多组学数据中恢复基因调控网络
基因调控网络(GRN)封装了转录因子(TF)、靶基因和各种调控元件之间复杂的相互作用,构成了基因调控的核心机制。基因调控背后的复杂机制构成了细胞功能和行为的基础。表观遗传修饰影响染色质结构和可及性,影响 TF 结合和 GRN 组装,最终驱动不同细胞类型的不同转录结果。因此,阐明细胞类型特异性的 GRN 对于促进我们对分化、发育和疾病发病机制等细胞过程的理解至关重要。
恢复 GRN 的早期努力依赖于实验验证,例如 Chromatin免疫沉淀和测序 (ChIP-seq)。虽然这些方法提供了高置信度的数据,但它们成本高昂、耗时,因此很难全面绘制 GRN。高通量RNA 测序(RNA-seq) 能够对大量细胞上的细胞 转录组进行全基因组分析,它彻底改变了 GRN 推断,能够从基因表达数据中计算推导调控网络。最初的方法主要依靠相关性或互信息来推断调控作用。例如,加权基因共表达网络分析(WGCNA)将共表达基因聚类到模块中,以构建基因关联。为了提高准确性和效率,基于机器学习的方法已经提出。GENIE3和 GRNBoost2分别使用基于树的集成方法和支持向量机来推断调控网络,捕获非线性相互作用并通过手动区分TF和靶基因来生成定向 GRN。最近,深度学习已被引入 GRN 推理中,利用 CNNGRN 来分析大量时间序列基因表达数据并推断 TF 与靶基因之间的调控关系。
单细胞 RNA 测序(scRNA-seq) 能够在单个细胞水平上进行基因表达谱分析,以单细胞分辨率揭示细胞异质性,显著增强了对细胞类型特异性基因调控的理解。然而,单细胞数据固有的高噪声水平和频繁的丢失事件推动了针对这些挑战而定制的更专业的方法的开发。例如,DynGFN结合了贝叶斯动态结构来对单细胞数据中循环 GRN 的后验分布进行建模,有效地捕获单细胞数据中复杂的结构不确定性。此外,先验生物学知识的整合极大地改进了 GRN 推理,例如 TRUST、ChEA3和 ChIP-Atlas。GeneLink引入了图注意力网络 (GAT),用于 GRN 推理中的监督链接预测,利用scRNA-seq 数据和现有的调控信息来预测潜在的 TF-基因相互作用。同样,Grace将结构因果模型与图神经网络集成,从 scRNA-seq 数据推断 GRN 和基因因果关系。然而,虽然这些方法成功地利用了先验数据并推断出细胞类型特异性GRN,但它们往往忽视了染色质水平的调控机制,例如染色质可及性。
染色质可及性突出了靶基因的潜在 TF 结合位点,从而能够从表观基因组景观中研究 GRN。单细胞 ATAC 测序(scATAC-seq) 技术可以在单细胞水平上以前所未有的分辨率识别染色质可及性图谱。特别是,像SHARE-seq这样的单细胞多组学技术,可以同时分析单个细胞内的转录组和表观基因组数据,从而能够探究细胞异质性和分子层次结构。因此,出现了许多通过整合多组学数据来恢复 GRN的方法。 scAI通过矩阵分解将稀疏的表观基因组信号与转录组信息结合起来,从而能够在细胞的统一低维表示中发现调控关系。类似地,SupirFactor直接嵌入先验GRN到深度学习架构,实现生物学上可解释的 GRN预测,同时通过解释的相对方差指标捕获高阶调控相互作用。然而,尽管取得了这些进展,这些方法仍难以从可解释的方式阐明这些源自多组学的生物因素,从而限制了它们在缺乏调控机制约束时推断 GRN 的能力。
最近,Zhang等人提出了 PRISM-GRN(图1),这是一种概率贝叶斯模型,旨在使用基于单细胞多组学数据的生物学可解释架构来恢复细胞类型特异性基因调控网络。基因调控机制表明,基因表达受到 TF 表达和染色质可及性(通过 TF-基因相互作用)的影响。因此,PRISM-GRN 将经过验证的细胞类型特异性先验 GRN与 scRNA-seq 和 scATAC-seq 数据集成到基于此机制的概率框架中,形成生物学上可解释的架构。通过基于机制的生成过程和先验 GRN 启动的推理过程,PRISM-GRN 将可观察数据分解为具有生物学意义的潜在变量,从而能够精确而稳健地重建细胞类型特异性的调控关系。PRISM-GRN 可以通过不同调控策略来执行 GRN 构建和因果关系预测任务。

图1 PRISM-GRN 框架。A. PRISM-GRN 动机。在同一细胞类型中,基因的表达受其靶向转录因子(TF)的表达水平和细胞类型特异性调控网络(GRN)下染色质的可及性影响。这种调控机制塑造了不同的基因表达模式,最终定义了具有不同状态和功能身份的细胞表型。B. 变分推理过程。PRISM-GRN 将基因表达的生成建模为 Dirichlet多项式分布,整合了三个关键潜在变量:表达相关因子, 染色质可及性相关因子和调控作用相关因子。这些潜变量是从观测数据中推断出来的,并由生物学机制进行结构化。生成过程基于这些因子重建表达水平和 GRN,确保PRISM-GRN 遵循调控原则。C. PRISM-GRN 的性能评估。PRISM-GRN 在重建 GRN 和捕捉因果关系方面的性能得到了全面评估,并与基线方法进行了比较。通过其在有限先验知识和非配对组学数据上的优异表现,进一步验证了 PRISM-GRN 的鲁棒性。此外,还进行了下游生物学分析,以突出 PRISM-GRN 在提高基因功能理解以及发现 GRN 方面的实际效能
参考文献
[1] Zhang W, Cao L, Gu X, Long Y, Wang Y. Recovering gene regulatory networks in single-cell multiomics data with PRISM-GRN. Genome Res. Published online October 9, 2025. doi:10.1101/gr.280757.125. https://genome.cshlp.org/content/early/2025/10/09/gr.280757.125
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社