||
GraphComm:使用图深度学习方法预测细胞通讯
了解多细胞生物及其功能能力需要深入了解细胞活动。这可以通过研究将诱导反应和下游效应的信号事件来实现。最常研究的信号传导事件通常涉及分泌配体与同源受体的结合,以细胞间(旁分泌)或细胞内(自分泌)方式结合。这些配体-受体相互作用在生物学中的重要性导致人们对通过计算揭示细胞通讯(CCC) 模式以及由此产生的健康、扰动和疾病条件下的表型效应越来越感兴趣。随后,CCC 的变化将有助于提高我们对组织功能和疾病进展的理解。直接细胞间通讯已被证明对肿瘤进展至关重要,这使得细胞能够从非癌细胞转移到癌细胞。用于模拟肿瘤中此类细胞间通讯的强大计算工具也有助于识别关键的患者选择生物标志物并改进药物反应的治疗方法。
确定 CCC 的主要挑战之一是在定义潜在配体受体对时缺乏基本事实,这限制了后续验证。识别其原生微环境中的相互作用通常需要昂贵的实验或广泛的领域知识来检测活跃的相互作用。为了提供一种更容易获得的方法来研究 CCC,单细胞转录组学已被纳入利用基因表达的证据来推断 CCC 活性。随着单细胞 RNA 测序技术越来越多地用于研究细胞类型和状态,迫切需要能够利用基因表达计数矩阵来预测经验证的配体-受体活性的计算方法。CellPhoneDB、Crosstalkr、Connectome、NicheNet 和 CellChat 等方法为开发可以在批量和单细胞水平上预测CCC 方法铺平了道路。基于这些方法的结果,将 CCC 方法应用于空间转录组学数据等不同模式的应用也越来越多,其中细胞坐标可以为可视化 CCC 预测提供基础。
然而,为了提高 CCC 预测的准确性和生物学相关性,必须解决多种限制。对于经过验证的配体受体(LR)对以及伴随的注释,例如蛋白质复合物信息和通路信息,缺乏一致的基本事实。为了在预测过程中最大限度地提高信息的可用性,需要确定 LR 相互作用和属性表示的新方法。深度学习是一个合适的应用候选者,其在生物网络的其他应用中的性能证明了这一点。通过深度学习模型使用配体受体的更详细视图可以获得反映转录组学值变化的 CCC 活性结果。例如,LR 信息可以与上下文特异性转录组数据结合使用,因为配体和受体编码基因的表达强度以前与它们的相互作用概率直接相关。通过在 CCC 预测框架中引入深度学习的利用,可以识别新的配体-受体相互作用,这些相互作用表明不同情况下的新细胞角色或细胞功能。
为了解决这些问题,So等人提出了 GraphComm(图1,https://github.com/bhklab/GraphComm),这是一种新的基于图深度学习方法,用于从单细胞转录组数据中预测 CCC。GraphComm 使用更详细的配体受体注释(例如蛋白质复合物和通路信息)以及表达值和细胞内信号传导的标记,使用前馈机制构建细胞相互作用网络,以学习最佳数据表示并预测 CCC 相互作用的概率。GraphComm 能够计算代表细胞群、配体和受体之间关系的通讯概率。因此,对于任何给定的配体-受体链接,可以提取基于计算嵌入的通讯概率并用于对 CCC 活性进行排名。GraphComm 的设计架构允许在预测中捕获有关细胞信号网络和转录组学信息的丰富信息,并使 GraphComm 能够同时确定多种交互的优先级。使用来自胚胎小鼠大脑、人类心脏和癌细胞系的单细胞转录组学数据,作者们证明了 GraphComm 在与先前鉴定的配体和受体对齐、识别药物扰动后癌细胞中 CCC 的生物学相关变化以及预测空间微环境中细胞间相互作用的效用。因此,GraphComm 有潜力成为一个强大且可翻译的计算框架,可以揭示转录组数据中的小型和大型通讯模式。

图1 GraphComm 架构。(A)GraphComm 利用带有精选配体受体数据库的单细胞转录组数据集来构建反映 CCC有向图。实现特征表示以提取位置有向图中配体和受体的信息,并根据蛋白质复合物和通路信息进行相应缩放。(B)GraphComm 构建第二个有向图,表示细胞群和源/靶蛋白之间的关系。使用特征表示学习步骤中的转录组信息、细胞群信息和位置特征注释第二个有向图,以通过图注意力网络接收更新的数值节点特征。然后,可以通过内积使用节点特征来计算所有可能的配体受体对的通讯概率。(C)通过图注意力网络计算的通讯概率可以与第二个有向图相结合,以构建具有CCC 活性的配体受体链接,可用于配体受体和细胞群水平的活性可视化
参考文献
[1] So, E., Hayat, S., Nair, S.K. et al. GraphComm predicts cell cell communication using a graph based deep learning method in single cell RNA sequencing data. Sci Rep 15, 36914 (2025). https://doi.org/10.1038/s41598-025-20812-1
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社