||
多组学动态网络生物标志物算法预测肺腺癌器官特异性转移
肺癌是全球死亡率最高的恶性肿瘤,每年死亡人数超过150万。肺癌病理类型85%以上为非小细胞肺癌(NSCLC),其中肺腺癌(LUAD)占40%以上。癌细胞转移,即癌细胞在远离其起源器官的器官中生长,是癌症的最终和最致命的表现,也是癌症死亡的最大原因。对于肺癌,据报道合并局部转移的患者5年总生存率不足20%左右,而远端病变患者5年生存率不足10% 。因此,早期发现和及时治疗肺癌转移的有效策略对提高肺癌患者的生存率具有重要意义。
转移是一个进化过程,涉及多个阶段,如癌细胞从原发肿瘤扩散到血液或淋巴系统,在血液和/或淋巴系统中生存,在远端器官新环境中生存,以及形成新的转移性肿瘤。在临床上,肺癌转移的标准检测方法仍然是影像学技术。然而,肺癌细胞可以转移到其他部位,甚至在原发肿瘤诊断之前。既往研究表明,原发肿瘤诊断前,肿瘤细胞迁移至淋巴结的平均时间为4.26±0.74年。胸膜转移和远处转移在发现原发肿瘤前的平均播散时间为2.11±0.33年。该研究结果与之前的一项包括乳腺癌、结直肠癌和肺癌在内的泛癌症研究结果一致,该研究表明,总体肺癌转移的起始年龄为3.6岁。因此,尽早识别肺癌转移非常重要,即使癌细胞仍处于转移前状态,没有特异性的器官亲和性,这是通过常规方法难以实现的。此外,由于疾病的隐蔽性,通过更临床可及的方法捕捉癌症转移的早期信号也很重要。
血液路径在肺癌骨和脑转移中占很大比例。同时,随着近年来液体活检技术的快速发展,各种研究旨在探索外周血中潜在的生物标志物,以预测肺癌的进展和转移。先前研究表明,癌细胞会分泌一些蛋白质,帮助通过外周血在特定器官中形成转移前壁龛,这可能有助于癌细胞随后的转移。对于肺癌,有报道称血清髓鞘碱性蛋白与肺癌脑转移呈显著正相关。此外,血清癌胚抗原(CEA)和骨桥蛋白(OPN)水平升高被认为是肺癌患者骨转移的早期预警信号。在前瞻性验证队列中,另一项纳入11项血清指标的研究被确定为NSCLC骨转移的独立预测因素,基于这些指标建立的随机森林模型可提前10.27±3.58个月预测骨转移的发生。然而,值得注意的是,大多数研究都是横断面研究,样本量较小,因此,其预测效果有待于在前瞻性、大规模队列研究中进一步验证。此外,大多数研究仅基于现有文献或检查对某些类型的血清标志物进行评估,而对血清蛋白的全面分析仍然缺乏,这限制了我们对血清分泌组促进肺癌器官特异性转移作用的充分认识。
为了解决这个问题,Zhang等人最近将包括四种主要类型肺癌远处转移的两个临床队列的数据与原发病变的单细胞RNA测序(scRNA-seq)和血清的液相色谱-质谱分析(LC-MS)数据进行重叠。然后,引入了动态网络生物标志物(dynamic network biomarker,DNB)方法。这是一种基于时间表达序列对基因表达网络进行数学建模的方法,该序列可以识别生物标志物,用于早期检测肺癌的转移前状态。该方法基于疾病发展经历三种状态的理论,即正常状态、疾病前状态和疾病状态。疾病前状态是一种不稳定的临界状态,在这种状态下,正常状态正在转变为疾病状态。此时,基因表达水平和基因网络结构发生了巨大变化。DNB基因是这些基因网络的核心。DNB方法已应用于结直肠癌和肝癌转移、上皮-间质转化、肺腺-鳞状细胞转分化、乳腺癌等多个领域的研究。传统的分子生物标志物是基于在单个时间点测量的差异分子水平来检测疾病状态,与之相比,DNB方法整合了时间信息,并且在识别肺癌转移发生前的关键时间方面具有优势。DNB系统推断的生物标志物可以预示远处转移的开始,突出肺癌从原位状态到器官转移状态的急剧转变。因此,DNB方法可以揭示肺癌转移前表达变化的关键基因和早期诊断有转移潜力的原位肺癌所必需的生物标志物。通过整合两个临床队列的结果,可以进一步获得指示器官特异性转移的血清关键蛋白,这些蛋白可以通过标准的实验室检查轻松检测到,并转化为临床可行的预测工具。
大多数研究只关注癌症转移后的疾病状态,缺乏对癌症转移前状态的深入分析。这在一定程度上是由于许多生物系统的时间进化并不总是平稳的,有时还会突然发生。因此,疾病的进展可以看作是一个非线性动力系统的进化,在某个器官或整个生物体发生变化后出现一个临界点。传统的生物标志物分析很难通过利用正常状态和疾病状态之间基因/蛋白质的差异表达信息来识别疾病状态,而不是发出疾病前状态的信号,因为它在表型和基因表达方面通常与正常状态相似。相比之下,DNB方法具有扎实的非线性动力系统理论背景,并且由于其必要条件是由临界点的一般特征在数学上推导出来的,因此可以准确地量化临界点。因此,通过DNB方法鉴定的转移前状态可以更新我们对肿瘤转移预测的认识,并可能有助于超早期诊断和治疗疾病。
在这项工作中,通过观察转移状态轨迹中关键基因的表达趋势,确定了每次转移的转移前状态,并在单细胞水平上描述了相应的转录组特征(图1)。此外,作者们成功构建并验证了基于神经网络预测转移部位的集成单细胞分类系统,并通过集成模型分类器方法进一步验证了结果,该方法可以更准确地区分肺癌的特定转移部位和静态转移部位。
图1 研究工作流程示意图。(i)基于两个患者队列的转移性分泌组多组学筛查;(ii)利用DNB算法发现转移前状态的基因组迹线;(iii)除了阐明无特异性器官性的癌细胞的中间状态外,通过细胞轨迹和伪时间重建器官转移;(iv)在单细胞水平上实现基于神经网络模型的远端转移预测
质谱蛋白质组学数据已通过iProx合作伙伴存储库数据库存入ProteomeXchange Consortium(存储号:IPX0009723000)。骨转移bulk RNA-seq数据已存入NCBI GEO数据库(存储号:GSE225208)。骨转移单细胞RNA-seq数据已存入NCBI SRA数据库(存储号:SRR29634661、SRR29634663、SRR29634662、SRR29634658、SRR29634659、SRR29634660),注册号:PRJNA1129208(https://www.ncbi.nlm.nih.gov/bioproject/PRJNA1129208)。本研究中使用的肺癌单细胞RNA-seq数据可在NCBI GEO数据库中获得(存储号:GSE148071)。原始单细胞RNA测序数据和原始蛋白质数据可以在Zenodo上找到。处理后的单细胞RNA数据和元数据可以从Zenodo下载为Seurat RDS文件,网址为https://zenodo.org/records/13764759。本文提供了源数据。MODNB方法的相关代码见https://github.com/zxsanalytics/MODNB。
参考文献
[1] Zhang X, Xiao K, Wen Y, Wu F, Gao G, Chen L, Zhou C. Multi-omics with dynamic network biomarker algorithm prefigures organ-specific metastasis of lung adenocarcinoma. Nat Commun. 2024 Nov 14;15(1):9855. doi: 10.1038/s41467-024-53849-3.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 12:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社