||
AMICI:细胞相互作用注意力机制解释
细胞间通讯协调着广泛的生物反应,从组织发育和稳态到疾病进展。单细胞分辨率的空间转录组学为在它们本源的组织环境中原位量化这些相互作用提供了前所未有的机会。然而,当前的计算方法仅捕捉了这个复杂对话的有限方面。大多数现有方法主要依赖粗略细胞类型的空间邻近性或与已知信号通路相关的总体表达模式。这包括空间共定位方法,它们识别比随机情况下更经常共同出现的细胞类型,以及相互作用模型,它们检测在紧密邻近出现的配体和受体基因对的显著高表达。尽管它们有用,这些方法无法捕捉到在单细胞分辨率下,细胞间通讯的动态性和依赖性,忽略了特定细胞类型的亚群如何通过转录变化驱动接收细胞中的依赖性表型可塑性。
近期基于图的方法,如 NCEM和 NicheDE,旨在通过关联邻近细胞类型的组成与接收细胞基因表达的变化来弥合这一差距。然而,它们通过固定半径或径向基函数(RBF)核来施加严格的邻近区域定义,这些定义难以调整,且不适用于跨不同长度尺度运作的相互作用。此外,它们对广泛的细胞类型注释的依赖掩盖了受空间线索影响的特定亚群。例如,M1与M2巨噬细胞等二元标签未能捕捉髓系状态的连续性,这些状态在局部环境影响下动态变化。类似地,肿瘤内空间受限或混合的免疫亚群在三阴性乳腺癌患者中与患者预后具有相反的关联,而调节性 T 细胞在缺氧和血管生成驱动的空间排列与更差的预后相关。
为解决这些局限性,GITIII和 CGCom等方法采用利用注意力机制的算法,将相互作用强度学习为邻近细胞完整转录组特征函数。然而,它们经常产生密集的注意力图,这些图通常难以解释且容易产生假阳性,限制了其生物学应用价值。
Hong等人提出了 AMICI(细胞间相互作用注意力机制解释,图1,https://github.com/azizilab/amici),它采用基于注意力机制的可解释计算框架,旨在自适应地学习不同空间尺度的相互作用,解析空间依赖的细胞相互作用亚群,并将相互作用与接收细胞下游的功能影响联系起来。此外,AMICI 的目标函数包含对注意力分数的稀疏性正则化,确保模型能够分离出哪些邻近细胞以及它们在什么距离上调节了接收细胞的转录程序。

图1 a. AMICI 通过重建加权邻居贡献来模拟掩码接收细胞的基因表达,捕捉该细胞类型的基线均值变化。b. AMICI 模型架构详细展示了输入和多头注意力层的预测输出。c. AMICI 的设计选择使其在推断细胞间相互作用方面优于现有方法。d. 生成半合成数据集的过程(左)和半合成数据集的空间细胞类型分布(右)。e. AMICI 推断的半合成数据集示例长度尺度分布(实线)以及用于生成数据集的真实相互作用长度尺度(虚线)。f. 预测每个真实相互作用下游基因的 10 个技术性半合成数据集重复的精确率-召回率曲线下面积(AUPRC)。展示了 NCEM 和 NicheDE 在不同带宽(σ或半径(rad))设置下的结果。标记 p 值<0.001 为****,<0.005 为**,<0.01 为**,<0.05 为*。与 AMICI 的 AUPRC 得分相比:NicheDE (σ = 20) 的 p 值为 0.0013,NicheDE (σ = 200) 的 p 值为 0.0013,NicheDE (σ = 500) 的 p 值为 0.0023,NCEM (rad = 10) 的 p 值为 0.0013,NCEM (rad = 15) 的 p 值为 0.0013,以及 NCEM (rad = 20) 的 p 值为 0.0013。g. 在半合成数据集的重复实验中,预测相关模型中相互作用发送细胞的 AUPRC。GITIII 的 p 值为 0.028,CGCom 的 p 值为 0.0003。h. 在半合成数据集的重复实验中,预测相关模型中相互作用接收细胞的 AUPRC。GITIII 的 p 值为 0.028,CGCom 的 p 值为 0.0004
参考文献
[1] Justin Hong, Khushi Desai, Tu Duyen Nguyen, Achille Nazaret, Nathan Levy, Can Ergen, George Plitas, Elham Azizi. AMICI: Attention Mechanism Interpretation of Cell-cell Interactions. bioRxiv, 2025.09.22.677860; doi: https://doi.org/10.1101/2025.09.22.677860
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社