xiaokeshengming的个人博客分享 http://blog.sciencenet.cn/u/xiaokeshengming

博文

《自然》:周玉昆等报道用于泛化疾病检测的AI视网膜基础模型RETFound

已有 1792 次阅读 2023-9-14 14:43 |个人分类:小柯生命|系统分类:论文交流

北京时间2023年9月13日晚23时,英国伦敦大学学院(UCL)和莫菲尔德眼科医院(Moorfields Eye Hospital)的周玉昆Pearse A. Keane等研究人员,在Nature杂志上发表了题为 A foundation model for generalisable disease detection from retinal images的研究论文。


该项研究报道了AI视网膜基础模型(RETFound)的开发和验证,旨在缓解AI模型对于巨量标注数据的需求,并增强模型在疾病探测任务上的泛化能力。RETFound是眼科领域第一个基础模型,具有当前最大规模之一的训练数据库和最全面的验证任务。


该开源模型(https://github.com/rmaphoh/RETFound_MAE)可应用于自定义的下游任务,促进多样化的眼科研究。


周玉昆和Pearse A. Keane为该文章通讯作者,周玉昆为第一作者。

10.png

医学人工智能(AI)能识别视网膜图像中所蕴藏的健康迹象,并因此在推进眼科疾病和系统疾病的诊断上具有巨大潜力[1]。然而,开发高性能AI模型通常需要大量高质量的标签,医学专家的标注容量已经无法满足呈指数级上涨的模型开发需求,导致大量医疗数据未被标注且充分利用。自监督学习可以通过“预文本任务”(pretext task)直接从数据中获取监督信号,而不是依靠专家知识来获得标签[2,3],从而减轻数据低效性。通过自监督学习,AI模型可以获得强大的表征学习能力(representation learning), 并在下游任务中提高微调的性能,例如诊断糖尿病黄斑水肿[4]。然而,由于大规模结构化临床数据和多元信息的稀缺,泛化性AI模型的开发和多样的任务验证一直缺失。

基础模型(foundation model)定义为在大规模未标注数据上进行自监督训练从而适应于各种下游任务的大型AI模型[5,6]。在这项工作中,研究人员通过自监督训练,在大规模未标注的视网膜图像上构建基础模型RETFound,并用它来促进多种疾病的检测。具体而言,该研究使用自监督技术Mask Autoencoder (Kaiming He et al.[7])依次在自然图像(ImageNet-1k)和160万的视网膜图像上进行训练,从而开发了两个的RETFound模型,一个用于彩色眼底摄影(colour fundus photograph),另一个用于光学相干断层扫描(OCT)。研究人员通过微调RETFound来适应一系列具有挑战性的疾病检测和预测任务。

9.png

在验证中,研究人员首先研究了眼部疾病的诊断分类,包括糖尿病视网膜病变和青光眼。研究人员在8个眼科公开数据集进行实验并观察到了性能的显著提升。为了研究更加广泛的应用,研究人员使用AlzEye数据集构建了眼科疾病预后任务(在老年黄斑病变人群中,预测未治疗眼(fellow eye)在一年内转化为新生血管性老年黄斑病变(wet AMD)的概率)和“oculomic”(利用视网膜图像观测系统疾病,包括缺血性中风,心肌梗塞,心衰,和帕金森病)。为了验证模型在不同数据集上的泛化性,研究人员使用UK Biobank作为外部测试集。RETFound在内部和外部验证上都显示了最佳性能。

与传统的迁移学习预训练模型和其他自监督模型相比,RETFound在适应下游任务时表现出一致的优秀性能和标签效率,例如在心梗和心衰预测上,RETFound只需要10%的标注数据就可以达到对比方法的最佳性能。研究人员还通过可视化分析和变量控制实验探讨了RETFound的疾病检测性能的解释。研究人员同时展示了RETFound在不同人群种族的一致性,为全球范围内的应用提供支撑。

该研究验证了RETFound在适应多种医疗应用中的功效和效率,展示了在检测眼部疾病方面的高性能和泛化能力,以及在预测系统疾病方面的显著改进。通过克服当前临床AI应用的障碍,尤其是标注数据的规模和性能以及泛化能力的限制,基于自监督学习的基础模型为加速、数据高效的设备打开了大门,这些设备可能会改变患有眼部或全身性疾病的患者的护理方式。

相关论文信息:

https://www.nature.com/articles/s41586-023-06555-x

参考文献

1. Rajpurkar P, Chen E, Banerjee O, Topol EJ. AI in health and medicine. Nat Med. 2022;28: 31–38.

2. Krishnan R, Rajpurkar P, Topol EJ. Self-supervised learning in medicine and healthcare. Nat Biomed Eng. 2022;6: 1346–1352.

3. Doersch C, Gupta A, Efros AA. Unsupervised visual representation learning by context prediction. ICCV. IEEE; 2015. pp. 1422–1430.

4. Azizi S, Culp L, Freyberg J, Mustafa B, Baur S, Kornblith S, et al. Robust and data-efficient generalization of self-supervised machine learning for diagnostic imaging. Nat Biomed Eng. 2023;7: 756–779.

5. Bommasani R, Hudson DA, Adeli E, Altman R, Arora S, von Arx S, et al. On the Opportunities and Risks of Foundation Models. arXiv [cs.LG]. 2021. Available: http://arxiv.org/abs/2108.07258

6. Wiggins WF, Tejani AS. On the Opportunities and Risks of Foundation Models for Natural Language Processing in Radiology. Radiol Artif Intell. 2022;4: e220119.

7. He K, Chen X, Xie S, Li Y, Dollár P, Girshick R. Masked Autoencoders Are Scalable Vision Learners. CVPR. 2021. pp. 16000–16009.




https://blog.sciencenet.cn/blog-3423233-1402609.html

上一篇:《自然》:杜克大学何胜洋/周沛/董珂合作团队揭示细菌侵染植物宿主新机理
下一篇:《自然》:伦敦大学学院团队建立从视网膜图像检测疾病的基础模型
收藏 IP: 183.198.202.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-29 04:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部