||
嵌入“受控”癌症异质性的单细胞RNA测序基准实验
肿瘤内的遗传和转录组异质性对患者对治疗的反应至关重要。自然选择的过程可以导致肿瘤内产生耐药细胞亚群。因此,这些亚群的鉴定和分子谱分析可以为破译肿瘤的进化提供有价值的见解。此外,肿瘤细胞类型的明确识别可能会发现治疗干预的新机会。类器官是探索肿瘤多样性和药物反应的有力工具。这些微观的、自我排列的三维结构模仿了体内相应器官的许多结构和功能特征。这种适应性强的技术促进了创新人类癌症模型的创建,使得从患有各种癌症的个体的肿瘤组织中产生类器官成为可能。类器官技术和单细胞组学的突破可能会改变癌症研究,提供全面分类细胞类型和识别肿瘤亚克隆的能力。
最近单细胞RNA测序(scRNA-seq)的应用为癌症的进展提供了新的见解,同时也更好地了解了肿瘤对治疗的反应。然而,由于来自scRNA-seq数据的单核苷酸变异(SNV)存在固有的噪声,使用scRNA-seq精确定位肿瘤内遗传异质性和检测亚克隆具有挑战性。尽管存在这一障碍,但考虑到肿瘤内的基因活性受到肿瘤细胞之间遗传差异的影响,将细胞分类为亚克隆并对每个亚克隆内的遗传修饰进行全面研究仍然是肿瘤学中任何scRNA-seq研究的重要组成部分。分析scRNA-seq数据来描述肿瘤亚群在很大程度上依赖于计算框架。然而,由于缺乏专门设计的基准实验,这些工具的整体性能很难得到解决。例如,处理基因组畸变和SNV的计算工具没有专门定义的基准数据集设计用于评估和工具验证,无论是在源自先前研究的数据集上还是使用合成数据上。
基准研究的主要目标是使用完全表征的基准数据集仔细评估和比较各种方法的有效性。这种评估允许确定每种方法各自的优点,并为给定的分析提供最合适的选择的指导。尽管如此,基准研究的设计和执行需要一丝不苟的关注,以确保结果既精确又公正,提供有价值的、不偏不倚的见解。作为基准实验实施指南的一部分,需要选择或设计具有代表性的数据集。在这里,Arigoni等人提出了一个基于10XGenomics技术的多用途基准数据集,旨在解决以下挑战:
1. 描绘了由不同癌症驱动基因控制的不同亚群。这可以使用7个独特的细胞系来实现,每个细胞系都有一个特定的驱动突变,其特征是在它们的功能途径中存在部分重叠(图1)
a. PC9, EGFR Δ19,激活突变;
b. A549, KRAS p.G12S,影响生长和增殖;
c. NCI-H1395 (CRL5868),BRAF p.G469A,功能突变获得,提供对所有测试的MEK + /−BRAF抑制剂的抗性;
d. DV90, ERBB2 p.V842I,增加激酶活性;
e. NCI-H596 (HTB178),MET Δ14,增强对凋亡的保护并促进细胞迁移;
f. HCC78,包含SLC34A2-ROS1融合,控制信号通路。对生长和生存至关重要;
g. CCL-185-IG,一种A549等基因细胞系,用于模拟具有棘皮微管相关蛋白样4 (EML4)-间变性淋巴瘤激酶(ALK)融合癌基因(EML4外显子13)的癌症患者;ALK外显子),对ALK20抑制剂敏感。
图1 嵌入“受控”肿瘤异质性的单细胞RNA-seq基准实验(A)实验流程概述(B)肿瘤驱动基因EGFR、ALK、MET、ERBB2、KRAS、BRAF、ROS1之间的功能关系
通过使用来自不同细胞系的不同比例的细胞,模拟现实生活中发现的异质性是可行的。这种方法将使评估计算工具有效识别亚种群的能力成为可能。
2. 描述以获得新的驱动突变为特征的不同亚种群。A549 (KRAS p.G12S)和CCL-185-IG,对于评估计算工具捕捉细胞亚群内细微变化的能力可能是有价值的,例如,药物治疗后癌症类器官内出现的变化。
3. 利用来自PC9、A549、CCL-185-IG和NCI-H1395 (CRL5868)细胞的scRNA-seq数据可以作为一种合适的方法来阐明EGFR突变的转录组与具有继发性分子驱动改变的耐奥西替尼非小细胞肺癌(NSCLC)的发展之间的联系。这些改变可能包括ALK融合或BRAF和KRAS突变。该数据集可作为评估预测不同次级分子驱动改变发生可行性的基础。
4. 上述七种细胞系为开发一类能够描述新的隐藏驱动基因的新型计算工具提供了理想的环境。
该数据集的目的是作为一种验证工具,通过单细胞分析专门用于表征癌症异质性的计算方法。这个数据集背后的基本思想需要利用同质细胞系来生成虚拟复制,确保对细胞组成异质性的全面理解。
该基准数据可以从链接https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE243665中获取。此外,作者们还创建了一个R Shiny应用程序(http://aisc.hpc4ai.unito.it:3838/),它可以通过以不同比例混合七个细胞系来生成稀疏矩阵。输出是10XGenomics格式的稀疏矩阵,细胞条形码包含相应细胞系的名称(如TCTGCCACATGTGCTA-1_ A549)。Shiny应用程序基于用户定义的细胞异质性特征的非重叠细胞产生几个用户定义的数据集。该特性对于生成基准数据集特别有价值,这对于验证通过单细胞分析表征癌症异质性的计算工具至关重要。
参考文献
[1] Arigoni M, Ratto ML, Riccardo F, Balmas E, Calogero L, Cordero F, Beccuti M, Calogero RA, Alessandri L. A single cell RNAseq benchmark experiment embedding "controlled" cancer heterogeneity. Sci Data. 2024 Feb 2;11(1):159. doi: 10.1038/s41597-024-03002-y.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 11:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社