Ammunition2019的个人博客分享 http://blog.sciencenet.cn/u/Ammunition2019

博文

论文赏析: ct DNA甲基化谱可用于结直肠癌的早期诊断、预后和筛查

已有 1089 次阅读 2020-11-27 15:34 |系统分类:科普集锦

题目:ct DNA甲基化谱可用于结直肠癌的早期诊断、预后和筛查

 

文献来源:Luo et al., Sci. Transl. Med. 12, eaax7533,1 January 2020;影响因子: 17.16

image.png

一、论文概要

本研究的目的是开发甲基化检测标记物,并应用于结直肠癌诊断、预后、筛查和癌症分型。

甲基化检测标记物的开发:通过公共数据库中的结直肠癌组织和正常组织的甲基化水平比较(t测验),筛选出甲基化水平差异显著的1000个CpG位点。通过测序验证和PCR扩增效果筛选,选出较好的 544个标记。为了进一步减少标记数量,作者使用LASSO算法和随机森林算法进行交叉筛选,最后获得9个最佳甲基化标记。

诊断模型构建与验证:将以上9个标记的甲基化水平作为独立变量构建Logistic多元回归模型,模型输出的Cp值是个体甲基化水平的综合指标,也是诊断结直肠癌的重要依据。根据Cp值的截断值,就可以确定患者是结直肠癌阳性还是阴性。

预后模型的构建与验证:通过对900名结直肠癌患者平均26.6个月的跟踪调查,构建起Cox回归模型。模型变量包括诊断模型检测结果Cp值,CEA浓度、TNM分期和原发性肿瘤位置和患者基本信息及病理信息。先用UniCox和LASSOCox方法降低变量维数。最后模型的变量包括患者的Cp分值、CEA浓度、TNM分期和原发性肿瘤位置。模型输入患者的以上参数,就可以得到一个Cd值。Cd值可准确预测患者的死亡风险 (训练队列AUC值0.82,验证队列AUC值为0.87)。

筛查方法建立与验证:选择检测性能最优的一个甲基化标记Cg10673833,建立起数字PCR检测方法,并在1493例高危患者群体中进行了验证。结果显示,检测敏感性为89.7%,特异性为86.8%。对于晚期癌前病变,其敏感性为33.3%,远高于同类产品SEPT9试剂盒(敏感性仅为11.2%)。

癌症分型模型与验证:选出45个标记物构建分型检测模型,在801例大肠癌患者中测试结果显示,肿瘤患者可以分成分期和预后显著不同的两个组。

围绕研究目的,作者开展了7个方面的研究:

1)  标记物开发;

2)  诊断模型构建

3)  诊断模型效果评价

4)  预后模型构建

5)  预后模型效果评价

6)  筛查效果评价

7)  癌症分型

以上7个方面的研究,在样本,数据,标记物,检测方法和检测效果方面各有不同,现归纳于下表:


表1、论文研究内容及其特点

研究内容

样本群体

数据来源

标记物

效果

标记物发现

459例结直肠癌样本,754例正常样本

甲基化芯片数据,结直肠癌样本来自TCGA,正常样本来自GSE40279

从全基因组选出1000个标记物

标记物的甲基化水平在肿瘤组织与正常组织间差异极显著

诊断模型构建

528例结直肠癌患者和674例对照

测序数据,来自中国人血液cf DNA

9个标记物

构建Logistic 回归模型,计算Cd值

诊断效果评估

273例中国人结直肠癌患者和347例对照者

测序数据,来自中国人血液cf DNA

9个标记物

准确率96%,敏感性,87.9%,特异性达89.6%

预后模型构建

900例中国人受试者,

测序数据,来自中国人血液cf DNA

5个标记物

通过平均26.6个月的跟踪调查,构建Cox回归模型,计算Cp分值

预后效果评估

900例受试者

测序数据,来自中国人血液cf DNA

5个标记物

Cp分值、CEA浓度、TNM分期和原发性肿瘤位置构建预后模型,可准确预测患者生存概率

筛查效果评估

1493例高危患者

数字PCR检测,来自中国人血液cf DNA

1个标记物Cg10673833

敏感性89.7%,特异性86.8%

癌症分型

801例大肠癌患者

测序数据,来自中国人血液cf DNA

45个标记物

将结直肠癌癌症患者分为两类,他们的分期和预后有显著差异

 

二、结论

 ctDNA甲基化谱可用于结直肠癌诊断、预后、筛查以及治疗效果的判断。

 

三、主要图表解析

图1. 试验设计与样本结构及其工作流程

图1A. 用cfDNA甲基化标记建立诊断和预后模型的工作流程:

 

微信图片_20201127152225.png

以上3种分析都是采取多元回归模型进行。诊断分析模型由9个标记物构成,预后分析模型由5个标记物组成,分子亚型分析模型由45个标记物组成。

 

图1B. 前瞻性筛查队列研究的试验设计与样本构成

 

微信图片_20201127152314.png

图2. cfDNA甲基化检测方法在结直肠癌诊断中的应用

 

微信图片_20201127152358.png

图2A是诊断模型构建的工作流程:

首先,从TCGA数据库获得结直肠癌患者甲基化水平原始数据并从GSE数据库获得正常人甲基化水平数据,经过预处理后构建成数据矩阵。样本按照2:1的比例随机分为2部分,三分之二的部分用于训练数据集(training cohort)用作模型构建,三分之一的部分用于验证数据集(validation cohort)用于模型的效果评估。

微信图片_20201127152437.png

图2B是甲基化测序结果的聚类分析图。

9个甲基化检测标记物由LASSO和随机森林法选出。图的第一行是肠镜检出的结果(红色为正常,蓝色为肿瘤),第二行是9个标记物组合检出的结果(黑色为正常,粉红为肿瘤)。第3行到最后一行分别代表9个不同标记物。颜色深浅代表甲基化水平高低,蓝色为0,红色为1。每一横条是一个标记物,每一纵条代表一名患者。

首先,求出9个标记物的甲基化水平之间的相关系数矩阵,对相关系数矩阵进行聚类分析即可得到以上聚类图。聚类分析结果显示,所有样本可分为3类:第一类标记物对阴性样本的检出率高,第三类标记物对阳性样本的检出率高,第二类介于两者之间,三类标记互补的结果使得9个标记物联合检测的效果与肠镜检出效果相近。

微信图片_20201127152519.png

图2D是ROC曲线分析图。该图的目的是以肠镜检测结果为标准,考察甲基化诊断模型的效果。AUC值是衡量诊断模型好坏的一个指标,取值范围0-1。本研究提出的诊断模型的AUC值高达0.96,表示甲基化检测的诊断模型预测的结果与真实结果非常接近。结果显示,结直肠癌诊断模型的敏感性为87.5%,特异性为88.9。训练数据集(图2D)与验证数据集(图2E)结果一致。

微信图片_20201127152609.png

作者还将甲基化诊断模型(AUC值=0.96)与常规CEA检测方法(AUC值=0.67)进行了比较。可见,甲基化诊断模型的准确率高于CEA检测方法(图2F)。

图3. cfDNA甲基化谱在结直肠癌患者生存概率预测中的应用

微信图片_20201127152654.png

图3A是建立甲基化检测预后模型的流程图

作者将801名患者分为两个队列,一个是训练队列共528人,用于模型构建,另一个是验证队列共273人,用于模型验证。对801名患者进行随访,中位随访时间为26.6个月(1-42个月)。采集的数据包括临床和人口学特征,包括年龄、性别、原发肿瘤部位和AJCC(美国癌症联合委员会)分期等。作者将每个患者的以上数据和甲基化检测数据作为模型变量,首先通过UNICOX和LASSO方法优选变量,然后将选出的5个变量构建了COX多元回归模型。模型输出的Cp值是患者结直肠癌的预后评分依据。

微信图片_20201127152724.png

图3B和图3C是在Kaplan-Meier生存分析结果。首先,根据Cox模型计算出每个患者的甲基化水平Cp值,根据Cp值的二分综合评分法将患者分为高风险(high)和低风险人群(low),然后分析高风险人群与低风险人群的生存概率是否有差异。

Kaplan-Meier生存分析是将死亡的发生与所经历的时间结合起来的一种统计分析方法。所有受试者在某一时刻仍未发生事件的比例称为(无进展)生存率;以生存时间为横轴,生存率为纵轴,并连接每个时间点的生存率,就可以得到生存曲线。

随着时间推移,生存率从 1 逐渐下降,而低风险人群(低甲基化水平,即Cp得分低)的生存曲线始终在高风险人群(高甲基化水平,即Cp得分高)之上,表明其生存率更高(图3B和图3C)。

微信图片_20201127152754.png

图3D和图3E分别是训练数据集和验证数据集的ROC曲线分析结果,用来评价不同预测模型的准确度。图中的AUC值显示了各种预测模型的准确度,CI是它的置信区间。结果显示,Cp值预测6个月生存率的效果(AUC值=0.75)比原发肿瘤位置、TNM分期、CEA浓度都要好,而Cp评分加上其他参数组合的预测效果(AUC值=0.82)更好。

图4. cfDNA甲基化谱在大肠癌患者亚型分析中的应用微信图片_20201127152830.png

图A是801例大肠癌患者的分型分析流程图。

801例样本分为训练样本528例和验证样本273例。选出样本间方差最大的45个标记物,计算两两标记物间相关系数形成相关系数矩阵,进一步进行主成分分析和聚类分析。

微信图片_20201127152905.png

图4B是训练数据集聚类分析结果:图的第一行是cfDNA甲基化标记的聚类结果,所有样本被聚成两类。第二到第八行是患者临床特征,分别是肿瘤的TNM分期,肿瘤位置,突变与否,MMR状态,MSS状态,肿瘤负担指数,性别。从第九行到最后一行是不同标记物的检测结果。没有这些信息的病人被涂成白色。每一纵行对应于一个患者样本。突变状态由以下基因突变来定义:BRAF、KRAS、NRAS和PIK3CA。

作者利用45个标记将结直肠癌样本聚类为甲基化水平显著不同的两个组(图4B,图4C和图4D)。为了探讨这两个组与临床性状的相关性,作者又考察了这两个样本组与临床因素的关系,包括TNM分期、肿瘤部位、错配修复状态、微卫星稳定性状态、肿瘤负担、性别、突变状态(包括KRAS、NRAS、BRAF、PIK3CA和PTEN突变)等。对它们进行了生存曲线分析。

结果显示,第1组的肿瘤常见于左侧病变的女性,通常诊断为早期(I和II)(图4E)。第2组的生存率明显低于第1组(图4E)。进一步分析表明,第2组的Cp得分均显著高于第1组(图B和C)。

Silhouette轮廓分析(图4C)是一种用来刻画聚类效果的分析方法。结果显示,聚类分析产生的两个样本组被清晰分开,分类效果很好。

微信图片_20201127152936.png微信图片_20201127153006.png

微信图片_20201127153044.png

微信图片_20201127153112.png

参考文献

Luo et al., Circulating tumor DNA methylation profiles enable early diagnosis, prognosis prediction, and screening for colorectal cancer, Sci. Transl. Med. 12, eaax7533 (2020) 1 January 2020




http://blog.sciencenet.cn/blog-3419762-1260133.html

上一篇:肠癌检测试剂盒竞品分析系列报告
下一篇:武汉艾米森生命科技有限公司大量招聘人才

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-1-24 08:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部