||
scSNViz:细胞特异性表达SNV的可视化和分析
细胞特异性表达的单一核苷酸变异(SNV)包括 DNA 转录的体细胞和生殖系变异,以及依赖上下文的 RNA 起源变异,所有这些都动态地促进了转录异质性。这些 SNV可以影响蛋白质功能、基因表达调控、转录和翻译效率以及细胞信号传导。在单细胞分辨率下对 SNV 分布和表达进行映射,可以提供关于细胞多样性和调控机制的宝贵见解。
随着 scRNA-seq 数据集的日益增多,人们越来越认识到 SNV 对细胞异质性的贡献,以及检测工具的快速涌现,都需要专门的工具来支持深入探索。
最近,Martinez等人介绍了 scSNViz(图1,https://github.com/HorvathLab/scSNViz),这是一个专门用于可视化、分析和图形表示细胞条形码 scRNA-seq 数据中 SNV 模式(例如 10x Genomics)的工具。scSNViz 提供了一套核心功能,包括 SNV 表达的定量分析、单个或一组(用户定义的组)SNV 的 2D 和 3D 可视化、基于细胞间表达特征的 SNV 聚类以及跨多个样本的比较分析。为了在更广泛的转录组背景下促进综合分析,scSNViz 与 Seurat等工具接口,用于细胞水平的基因分析,Slingshot用于轨迹推断、scType用于细胞类型注释,以及 CopyKat用于拷贝数变异分析。它提供灵活的输入选项,包括 SCReadCounts 输出和用户定义的 SNV 列表。

图1 (a) scSNViz 工作流程:scSNViz 接受原始或处理后的基因-细胞表达值作为其第一个输入,以及一个包含细胞条形码的 SNV 列表作为其第二个输入。建议通过 SCReadCounts 处理 SNV 列表,以便基于参考和变异读数的数量进行定量可视化,以颜色渐变表示。经过 SCReadCounts 处理的数据还能够在仅含参考读数、仅含变异读数和无读数的 SNV 位点之间进行区分,从而允许具有单等位基因参考表达和单等位基因变异表达的细胞。(b) SNV 集合:整体统计指标,并按 scType 进行细胞类型分类(scSNViz 中提供该选项)。为增强可视化效果,用户可从多种可定制的颜色设计中选择,包括单色和双色渐变。该可视化示例基于公开可访问的神经母细胞瘤肿瘤组织样本 SAMN12799270。(c) scSNViz UMAP 可视化展示了样本 SAMN13012147(胆管癌原发肿瘤)中可能具有胚系起源的个体 SNV。对于提交列表中的每个 SNV,可视化展示了 VAF_RNA、N_VAR 和 N_REF,以评估等位基因特异性表达。不同的模式区分了杂合 SNV 和纯合 SNV,纯合变异显示出变异等位基因的专一表达——从而可根据等位基因配置进行清晰区分。 (d) scSNViz UMAP 可视化显示了单个 SNV 17:48895725 C > T 在 ATP5MC1 中的表达情况,对应先前报道的体细胞突变 COSV63506293,跨越三种不同肿瘤样本:前列腺癌、非小细胞肺癌和胆管癌。在所有样本中,观察到相似的二等位基因表达模式。(e) scSNViz UMAP 可视化显示了单个 SNV Y:2865219_C > T 在 RPS4Y1 中的表达情况,可能源自 RNA,跨越三种不同组织样本:正常胎儿肾上腺、胆管癌和前列腺癌。在所有样本中,观察到相似的表达模式,且 N_VAR 和 VAF_RNA 值较低。(f) scSNViz UMAP 可视化显示了来自杂合位点的单个 SNV,在单细胞水平上表现出随机单等位基因表达。这些模式的特点是表达变异等位基因或参考等位基因的细胞数量相似,通常由低读取计数(通常少于 10)支持。此类表达谱与 X 染色体失活和转录爆发均一致
应用 scSNViz 探索了 28 个公开可用的原发性肿瘤和正常组织样本中的多样化生物学背景,包括:前列腺癌、非小细胞肺癌、胆管癌以及一个结合了神经母细胞瘤、正常胎儿肾上腺和正常胚胎的队列。
参考文献
[1] Siera Martinez, Tushar Sharma, Luke Johnson, Allen Kim, Vania Ballesteros Prieto, Hovhannes Arestakesyan, Sunisha Harish, Jewel Dias, Joseph Goldfrank, Nathan Edwards, Anelia Horvath, scSNViz: visualization and analysis of cell-specific expressed SNVs, Bioinformatics, Volume 42, Issue 2, February 2026, btag023, https://doi.org/10.1093/bioinformatics/btag023
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-10 02:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社