||
DeepCCI:从单细胞RNA测序数据中识别细胞-细胞相互作用的深度学习框架
多细胞生命依赖于细胞活动的一致性,而细胞活动依赖于不同细胞类型之间的细胞-细胞相互作用(CCIs)。单细胞RNA测序(scRNA-seq)技术在前所未有的分辨率水平上理解细胞机制方面取得了显着进展。尽管scRNA-seq数据本身包含可用于识别细胞间通讯的基因表达信息,但探索潜在的CCI仍然是一个巨大的挑战,这些CCI通常会驱动异质性和细胞状态转变。细胞背后的信号事件通常是由各种蛋白质的相互作用介导的,包括配体-受体(L-R)、受体-受体和细胞外基质-受体的相互作用。特别是,多亚基L-R复合物对CCIs至关重要。一些蛋白质,如TGF-beta(转化生长因子- β)受体10和细胞因子受体,需要多亚基组装才能发挥功能。具体而言,在TGF-beta信号通路中,可溶性配体TGFB1与I型和II型受体异质复合物(TGFBR1和TGFBR2)的相互作用在糖尿病肾病的发生发展中起着重要作用。
为了从scRNA-seq数据中识别CCI,已经开发了几种基于L-R基因对的计算策略,如iTALK、CellPhoneDB和CellChat。每种策略都包括细胞间相互作用的先验知识资源和识别潜在CCI事件的方法。然而,这些策略的鉴定结果通常受到先前L-R基因对数据库全面性的限制。每种方法中使用的不同的L-R对数据库可能有助于确定各种相互作用。此外,鉴定异质性scRNA-seq数据中以前未表征的细胞类型是鉴定CCI的先决条件。然而,在相互作用鉴定之前,这些方法不能独立地将细胞分类到细胞簇中。此外,由于目前捕获单细胞蛋白质组学信息的技术困难,定义CCI网络的基础真相具有挑战性。最近,基于深度学习的方法在广泛的单细胞研究中展示了它们的实力。然而,目前还没有从scRNA-seq数据中预测CCI的深度学习框架。将scRNA-seq数据与深度学习技术相结合将大大扩展,为CCI预测提供独特的见解。
在这里,Yang等人开发了DeepCCI(图1),这是一个基于图卷积网络(GCN)的深度学习框架(https://github.com/JiangBioLab/DeepCCI),用于从scRNA-seq数据中识别CCI。为了一站式探索scRNAseq数据中细胞之间的相互作用,DeepCCI提供了两种深度学习模型:(i)基于GCN的细胞聚类无监督模型,以及(ii)基于GCN的CCI识别监督模型。DeepCCI通过利用来自scRNA-Seq数据的异质性细胞的潜在复杂基因表达模式,具有聚集细胞和捕获细胞簇之间有生物学意义的相互作用的巨大潜力。DeepCCI首先学习一个嵌入函数,该函数使用Autoencoder (AE)和GCN将单元联合投影到共享嵌入空间中。通过使用嵌入信息,DeepCCI将细胞分成若干组。然后,手动策划了一个综合的信号分子相互作用数据库,称为LRIDB,用于L-R相互作用。根据LRIDB的说法,DeepCCI可以预测给定scRNA-seq数据中任何一对簇之间的细胞间串扰。此外,DeepCCI还提供了几个可视化输出,以显示每个细胞簇与其他细胞簇相互作用的强度或特异性。通过将DeepCCI应用于几个公开可用的scRNA-seq数据集来展示其整体能力。结果表明,DeepCCI在从scRNA-seq数据中捕捉细胞之间的生物学关系和CCI预测方面具有良好的潜力。
图1 DeepCCI工作流程。a, DeepCCI将scRNA-seq数据作为输入。b, DeepCCI利用AE和GCN联合对细胞进行聚类。c, scRNA-seq数据与细胞类型。 d, LRIDB包含从几个公开文献支持的数据库中收集的经过验证的L-R交互。e, DeepCCI联合使用ResNet和GCN预测细胞簇之间的相互作用。f, DeepCCI为不同的分析任务提供了几种可视化输出
参考文献
[1] Yang W, Wang P, Luo M, Cai Y, Xu C, Xue G, Jin X, Cheng R, Que J, Pang F, Yang Y, Nie H, Jiang Q, Liu Z, Xu Z. DeepCCI: a deep learning framework for identifying cell-cell interactions from single-cell RNA sequencing data. Bioinformatics. 2023 Oct 3;39(10):btad596. doi: 10.1093/bioinformatics/btad596.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 22:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社