||
CanCellVar:人类癌症单细胞变异图谱数据库
癌症的发生与变异密切相关,包括DNA中的单核苷酸变异(SNV)和mRNA中的A>G RNA编辑。这些变异是细胞增殖和肿瘤发生的重要驱动因素,通常与癌症的进展和生长有关。在肿瘤发生过程中,大量的变异不断积累,导致不同的亚群。分布模式、变异频率和谱在不同的癌症之间甚至在同一种癌症的不同肿瘤之间差别很大。准确测量遗传变异和描述全谱变异对了解癌症至关重要。数千种癌症已经被测序,大量SNV从大量DNA测序(DNA-seq)中被捕获,并建立了数据库,以促进变异模式和临床结果的探索。例如,癌症基因组图谱(TCGA, https://www.cancer.gov/tcga)、国际癌症基因组联盟(ICGC, https://dcc.icgc.org/)、癌症体细胞突变目录(COSMIC)和精确肿瘤学知识库(OncoKB,http://oncokb.org/)。A>G编辑组已被全面分析,并使用大量RNA测序(RNAseq)数据在多种癌症中观察到全基因组改变的A>G RNA编辑模式。目前有几个癌症RNA编辑数据库可供公众使用,如TCET和GPEdit。这些数据库是了解癌症变异和促进进一步基础和临床研究的宝贵资源。目前,大多数关于变异的研究和数据库分析的是大块肿瘤,它是癌细胞、免疫细胞和基质细胞的混合物,反映了不同亚克隆的平均特征。然而,在单细胞分辨率下,癌细胞以及浸润性和驻留性宿主细胞的变异异质性景观仍然很大程度上未知。
单细胞RNA测序(scRNA-seq)技术的快速发展为在单细胞水平上区分细胞群和研究肿瘤异质性提供了能力。在癌症单细胞研究中,SNV分析是一种新兴且有前景的策略,通过将细胞水平的遗传变异与肿瘤表型特征联系起来,并询问异质细胞群体中的谱系关系,提供SNV功能的关键信息。有研究表明,基于scRNA-seq数据,从单个细胞中调用SNV具有巨大的潜力。通过查询scRNA-seq转录本,从每个肺癌细胞中鉴定出体细胞改变,发现一半的样本含有临床已知的致癌驱动因子。根据来自scRNA-seq数据的变体,可以大致推断出肾癌中基质细胞和谱系追踪骨髓细胞发育的克隆性。通过scRNA-seq技术,在5个冷冻保存的急性髓性白血病(AML)样本中发现了数百至数千个含有肿瘤特异性突变的细胞。此外,已经开发了一些算法/管道来从scRNA-seq数据中执行从头体细胞突变调用,如SClineager、SCReadCounts、scSNV和scAllele。这些分析和管道可以补充基于DNA的SNV研究,并最大限度地发挥scRNA-seq数据集的潜力,这些数据集可以深入了解转录代表的突变景观。重要的是,检测细胞水平的变异可以帮助阐明肿瘤体细胞突变的进化和功能,有助于理解肿瘤细胞异质性及其与表型的关系。随着越来越多的癌症scRNA-seq数据集,挖掘和总结单细胞变异可以提供一个更精细和更高分辨率的癌症视图。最后,需要一个用户友好的数据库,包括丰富的单细胞变异数据和有效的工具来研究人类癌症的遗传异质性。
最近,Yang等人开发了CanCellVar (http://bio-bigdata.hrbmu.edu.cn/CanCellVar/search.jsp),它是一个全面的数据库,可以探索和可视化肿瘤微环境中单细胞变异的景观(图1A)。CanCellVar手动整理了来自多个数据库的37种癌症类型的公共5103个scRNA-seq数据集的可用原始数据。还在多种细胞类型中发现了单细胞变异,包括SNV和A>G RNA编辑,并构建了泛癌变异图谱。此外,还进一步研究了变异的功能特征和临床相关性,如细胞发育轨迹、细胞间通讯、基因表达、药物敏感性、microRNA (miRNA)和RNA结合蛋白(RBP)调控的扰动以及结构扰动。CanCellVar提供了一个设计良好的用户友好界面,用于搜索、浏览和分析数据。CanCellVar数据库能够成为研究人类癌症单细胞变异的重要资源。
图1 CanCellVar的数据内容和接口。(A)单细胞突变数据处理流程,包括原始数据预处理和六个主要模块的数据处理,以及CanCellVar web工具的构建。(B)样品和细胞的数量。(C)变异数和在大于50个细胞中检测到的变异数。(D)元素中变体的分布。(E)细胞类型的变异分布。(F)临床特征变异的分布。
参考文献
[1] Yang C, Liu Y, Lv C, et al. CanCellVar: A database for single-cell variants map in human cancer. Am J Hum Genet. 2024. doi:10.1016/j.ajhg.2024.05.014
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 16:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社