KeAi Publishing 植根中国 影响 ...分享 http://blog.sciencenet.cn/u/keaipublishing

博文

Fundamental Research 助力肿瘤精准分型!scCluster整合转录组与基因变异,准确识别癌症细胞亚群

已有 251 次阅读 2026-4-21 14:35 |系统分类:科研笔记

识别癌症组织中独特的细胞亚群是理解肿瘤异质性、耐药性和转移机制的关键。本文针对现有单细胞聚类方法过度依赖基因表达量、忽略原始数据中基因变异信息的局限,提出了一种名为scCluster的端到端深度聚类模型。实验结果显示,scCluster在多个真实癌症数据集上的表现优于Seurat等主流方法,不仅提升了细胞分群的准确性,还为癌症发育轨迹分析提供了更清晰的视角。这一工具为精准医疗背景下的肿瘤研究提供了重要的算法支持。

image.png

中文标题:scCluster整合转录组与基因变异,准确识别癌症细胞亚群

英文原题:Enhancing cell subpopulation discovery in cancer by integrating single-cell transcriptome and expressed variants

通讯作者:

尚学群,西北工业大学

关键词:单细胞亚群;癌症;特异性表达;多组学数据整合;深度学习

背景介绍

单细胞RNA测序(scRNA-seq)技术为在单细胞水平研究细胞行为和异质性提供了有力工具。通过识别不同的细胞亚群,研究人员可以深入了解肿瘤的发展、转移以及对治疗的反应。目前,识别细胞亚群的主要手段是对单细胞转录组谱应用无监督聚类算法。

尽管Seurat、SC3等现有方法在临床和基础研究中得到了广泛应用,但它们大多主要关注定量后的基因表达特征。研究表明,原始测序数据中潜在的基因变异信息同样具有重要价值。在肿瘤组织中,特定的遗传变异往往与特定的细胞亚群相关联,并可能驱动肿瘤的进展。此外,由于测序过程中的随机性,基因表达数据往往存在较高的噪声,而引入遗传变异信息作为补充,可能有助于提高细胞分类的稳健性。因此,如何有效地整合基因表达谱与表达变异特征,成为进一步优化细胞亚群鉴定的一个研究方向。

研究成果

本研究提出了一种名为scCluster的无监督深度聚类框架,旨在通过整合基因表达和表达变异(eSNP)特征来提升癌症细胞亚群的识别精度。

在模型架构上,scCluster采用了两阶段的优化策略。在预训练阶段,模型使用基于零膨胀负二项(ZINB)分布的双模态自编码器,将表达特征和变异特征编码到潜空间中。这种设计考虑到了单细胞数据高稀疏性的特点,有助于提取更具代表性的低维特征。在微调阶段,模型进一步结合了深度嵌入聚类(DEC)、深度软K-means聚类(DSK)和跨实例引导对比聚类(C3)技术。这些技术的引入旨在优化潜空间中的表示,增强不同细胞簇之间的辨识度(图1)。

image.png

图1  scCluster模型框架图

为了验证模型的有效性,研究团队在黑色素瘤、胶质母细胞瘤和乳腺癌三个真实的癌症单细胞数据集上进行了对比实验。结果显示,与Seurat、scVI、scDCC等主流算法相比,scCluster在聚类准确度(ACC)、调整兰德系数(ARI)等评价指标上表现出了一定的优势。

消融实验进一步证实,融合表达特征与变异特征的效果通常优于使用单一特征。特别是在轨迹推断分析中(以肾细胞癌数据集为例),引入变异特征后的细胞演变路径比仅使用表达特征时更加清晰,这表明表达变异特征能为研究细胞发育过程提供额外的生物学线索。此外,通过对模型识别出的标记基因(如S100A6、PRDX2等)进行分析,验证了所识别亚群在黑色素瘤研究中的生物学意义。

未来方向

虽然scCluster在癌症数据集上表现出了较好的聚类性能,但在实际应用中仍存在一些局限性。未来的研究工作将探索如何引入更多维度的生物信息,例如单细胞表观遗传数据等,以进一步提升模型在不同生物学场景下的适用性。同时,研究团队也计划开发更具鲁棒性的特征筛选策略,以减少测序偏差对变异调用带来的影响,从而提供更可靠的细胞亚群分析工具。

引用本文

Tao Wang, Duoduo Mai, Han Shu, et al. Enhancing cell subpopulation discovery in cancer by integrating single-cell transcriptome and expressed variant. Fundamental Research, 6(1) (2026) 88-98.

原文链接(复制到浏览器中查看):https://www.sciencedirect.com/science/article/pii/S2667325825000044

关于Fundamental Research

Fundamental Research是由国家自然科学基金委员会主管、主办的综合性英文学术期刊。创刊于2021年,期刊立足反映国家自然科学基金资助的优秀成果,全方位报道世界基础研究前沿重要进展和重大创新性成果,提升中国基础研究和中国科学家在国际科学界的显示度和影响力,为中外科学家打造一个高端的国际学术交流平台。内容涵盖数学物理、化学化工、生命科学、地球科学、工程与材料科学、信息科学、管理科学、健康医学、交叉科学等领域,设置Article、Review、Highlight、Perspective、Commentary、Letter和News&Views等栏目。期刊已被ESCI、Scopus、DOAJ、PubMed、CAS(美国化学文摘社)、CSCD(中国科学引文数据库)、CSTPCD(中国科技论文与引文数据库)等国内外知名数据库收录。2024年影响因子6.3,位于综合性期刊Q1区。2024年入选中国科技期刊卓越行动计划二期英文梯队期刊项目。2025年入选《FMS管理科学高质量期刊推荐列表》B区。欢迎广大科研工作者关注、投稿、引用!



https://blog.sciencenet.cn/blog-3496796-1531383.html

上一篇:SSB丨马克斯克鲁维酵母CRISPR/Cas12a基因组编辑工具箱的开发及丁二酸生物合成应用
收藏 IP: 124.17.26.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-21 18:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部