||
scSurv:单细胞存活分析的深度生成模型
生存分析是一种广泛应用于各个领域的统计方法,用于模拟特定事件发生的时间,并考虑多个协变量的影响。这些模型通常包含两个主要部分:基线风险函数,表示所有协变量均不存在时的潜在风险;以及效应参数,用于量化解释性协变量如何影响风险函数。其中,Cox 比例风险模型应用最为广泛。这种半参数模型假设协变量对风险函数具有乘法效应,并且允许在不指定基线风险函数形式的情况下估计效应参数。
Cox 比例风险模型显著增强了对通过下一代测序(NGS)获得的分子谱之间关联的分析。质谱分析和生存时间等技术能够识别预后因素并构建预测模型。然而,基于群体平均值的传统方法存在局限性,尤其是在处理疾病固有的细胞异质性以及不同组织和细胞类型在病理学中的具体作用时。肿瘤及其微环境中的细胞多样性和细胞间相互作用会影响疾病进展和治疗反应,这凸显了在细胞水平上进行更精确分析的必要性。
单细胞测序技术的最新进展使得高分辨率地表征基因表达模式和单个细胞状态成为可能,为疾病机制研究和治疗靶点识别提供了新的见解。然而,由于技术和经济方面的限制,整合单细胞数据和临床信息的大规模队列研究仍然有限。相比之下,与临床结果相关的批量 RNA 测序数据则广泛可用。尽管分辨率较低,但这些数据对于分析分子谱与临床结果之间的关系仍然很有价值。
近年来,计算技术的进步使得从批量 RNA 测序数据中估算细胞类型比例成为可能。然而,基于细胞类型的反卷积模型本质上将分析限制在这一层面,无法捕捉单个细胞状态或功能的差异。这些局限性阻碍了我们阐明详细的生物学机制,包括细胞状态的细微变化或特定亚型与生存结果之间的关联。因此,一些关键的生物学见解可能会被忽略,尤其是在癌症等具有显著肿瘤内异质性的复杂疾病中。
最近,Mizukoshi等人通过开发 scSurv (图1,https://github.com/3254c/scSurv)来克服这些局限性。scSurv 是一种新型的单细胞生存分析方法,它扩展了 Cox 比例风险模型,使其能够纳入细胞异质性。scSurv 以单细胞 RNA 测序数据为参考,对批量 RNA 测序数据进行解卷积,从而推断单细胞比例并量化它们对患者预后的个体贡献。scSurv 通过分析生存时间和细胞丰度之间的关联,系统地识别导致疾病风险的细胞及其特定的基因特征。
图1 scSurv工作流程
模拟结果表明,scSurv 利用反卷积得到的单细胞比例能够准确预测患者预后。将该方法应用于癌症基因组图谱(TCGA)数据,发现它能够预测多种癌症中被排除在训练集之外的患者的生存时间。scSurv 识别出了影响黑色素瘤患者预后的特定细胞以及与这些预后相关的基因。它还成功地重现了已知的影响患者预后的巨噬细胞分类。对肾细胞癌进行空间转录组分析,实现了全组织风险映射,并识别出了不同的预后相关空间区域。此外,还识别出了在多种癌症中对预后有贡献的基因。最后,将该方法应用于传染病,证明了其在癌症和生存结果之外的实用性。这种新方法阐明了单个细胞对临床结果的贡献,并为临床分析提供了新的视角。
参考文献
[1] Mizukoshi C, Kojima Y, Hayashi S, Abe K, Kasugai D, Shimamura T. scSurv: a deep generative model for single-cell survival analysis. Bioinformatics. 2026 Jan 2;42(1):btaf671. doi: https://doi.org/10.1093/bioinformatics/btaf671.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-11 14:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社