||
单细胞分辨率的表达和变异联合分析
癌症持续构成重大的全球健康挑战,根据GLOBOCAN 2022数据库(https://gco.iarc.fr/en)报告,2022年全球新增约2000万癌症病例并导致1000万人死亡。癌症治疗研究进展面临的主要障碍是肿瘤异质性的复杂性,这种多因素现象会影响诊断准确性、治疗效果和预后判断。肿瘤异质性包括肿瘤间异质性和肿瘤内异质性:前者指不同患者同类型肿瘤之间的差异;后者指同一患者单个肿瘤内同时存在具有不同基因型、表型和功能的多个癌细胞亚群。肿瘤间异质性会影响精准癌症诊断和有效治疗,已被证实是多种癌症患者生存率降低的预后因素,也是驱动肿瘤进化与治疗耐药的关键因素。高通量测序平台(包括全外显子组测序和全基因组测序)的发展实现了对肿瘤异质性的定量表征,这些技术有助于重建肿瘤克隆结构,揭示耐药性的进化轨迹与潜在机制。然而,传统批量测序方法缺乏单细胞分辨率,限制了亚克隆结构的精确描绘,也制约了我们对肿瘤异质性时空动态变化的深入理解。
单细胞测序技术的发展使得基因及其功能改变的研究得以延伸至单细胞水平。单细胞基因组测序是识别单细胞体细胞突变的最佳途径。然而,由于每个细胞仅包含两个DNA拷贝,单细胞DNA测序面临诸多挑战,如扩增偏倚和低覆盖率等问题,这会降低单细胞DNA测序的数据质量并增加突变识别难度。作为替代方案,体细胞突变可直接通过高通量单细胞检测技术(如单细胞RNA测序)进行识别。值得关注的是,10X Genomics单细胞RNA测序凭借其高通量、成本效益、高mRNA检测灵敏度以及捕获稀有细胞群体的强大能力,在转录组分析中得到广泛应用。该技术通过阐明肿瘤异质性的潜在机制,包括克隆进化动力学、免疫微环境内的相互作用以及细胞亚群间的转录可塑性,显著增进了我们对肿瘤生物学的理解。更重要的是,单细胞RNA测序数据集中蕴含包括体细胞突变在内的潜在基因组信息,但由于方法学限制,这些信息尚未得到充分挖掘。
当前基于10X Genomics单细胞RNA测序数据的突变检测计算工具(包括cellSNP、Monopogen和SComatic)存在若干局限性。这些问题主要表现为:受限于细胞类型注释的分辨率导致准确性受限、低频突变检测灵敏度不足,以及缺乏能够整合单细胞转录组数据与突变信息的综合性软件平台。
为克服这些挑战,Zhao等人开发了scVar框架(图1,https://github.com/WeiZhaoLuck/scVar)。该框架将突变检测能力从批量转录组数据扩展至单细胞水平,支持直接基于10X Genomics单细胞RNA测序数据从头识别单核苷酸变异(SNV),且无需匹配的正常样本或预定义的细胞类型注释。该框架可无缝集成至标准10X Genomics工作流程,支持完整的单细胞转录组分析、SNV检测,以及下游综合性分析与可视化功能,使用户能够在单细胞分辨率下关联转录异质性与遗传变异,并深入探究突变谱系特征。
图1 scVar工作流程概览。始于数据预处理、序列比对、质控控制、基础单细胞转录组分析与细胞类型注释;核心环节涵盖突变处理流程,包括体细胞变异识别、基因分型、变异筛选与功能注释;最终形成在scVar框架内实现的集成分析模块
参考文献
[1] Wei Zhao, Fei Yang, Wenting Zong, Xinchang Zheng, Yiming Bao. Joint analysis of expression and variation at single cell resolution by scVar. bioRxiv 2025.10.12.681753; doi: https://doi.org/10.1101/2025.10.12.681753
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社