|
摘要
文章基于随机对照试验研究系统讨论了大语言模型在消化疾病临床领域的应用。目前已发表的4项试验与正在进行的10项试验表明,ChatGPT等人工智能工具正越来越多地应用于临床决策和患者教育。但基于真实患者结局、可靠且具有国际代表性的证据仍不足。
研究内容
大语言模型(LLMs)如ChatGPT已迅速应用于医疗健康领域,但在真实临床实践中的高质量证据仍较为匮乏。本研究首次全面梳理了大语言模型在消化疾病领域应用的随机对照试验。
这项研究由一支国际团队组成,他们系统地梳理了自2022年以来已发表及正在开展的随机对照试验,最终在全球范围内筛选出14项符合条件的试验 —— 其中4项已发表,10项仍在进行中。这些研究大多在中国和美国开展,主要集中在胃肠疾病与肝胆疾病领域。大语言模型多以问答方式应用于临床决策与患者教育。
该研究第一作者、中国科学院深圳先进技术研究院的吴鹏博士表示:“我们发现,尽管在消化疾病领域应用大语言模型的热情日益高涨,但相关的高质量临床证据依旧十分匮乏。随机对照试验对于验证这类工具是否能切实改善患者结局、提升医疗质量至关重要。”
尽管许多研究声称其项目具有一定临床意义,但只有一部分研究使用了真实的患者数据,而且大多数试验是单中心的探索性研究。作者还发现,通用模型(如ChatGPT)和专业的医疗语言模型都在接受测试,这反映了将人工智能整合到临床工作流程中的不同策略。
共同通讯作者杨智荣博士强调需要谨慎部署大语言模型,他表示:“大语言模型不应取代临床医生,相反,它们应被视为辅助工具,在保持人类监督的同时拓展AI的临床应用性能。”
该综述还强调了当前研究中的几个不足之处,包括缺乏国际多中心试验、报告标准不一致,以及有限的伦理风险(如幻觉输出、数据隐私等)的评估能力。作者呼吁未来的试验采用标准化的报告指南,并关注真实世界中患者结局提升。
总体而言,这项研究及时呈现了人工智能语言模型从实验工具逐步转变为消化医疗领域潜在临床助手的现状,同时也强调了在广泛应用之前,我们仍需要更有力的证据来支持。
该研究内容已发表在期刊Gastroenterology & Endoscopy上,欢迎领域内的学者同仁阅读、下载及引用。
文章信息
Wu P, Li F, Jia Y, et al. Randomized controlled trials evaluating large language models in digestive diseases: a scoping review. Gastroenterology & Endoscopy, Volume 3, Issue 4,2025, Pages 232-240,
https://doi.org/10.1016/j.gande.2025.09.003

期刊介绍

Gastroenterology & Endoscopy(国际标准出版物号:ISSN 2949-7523),是由北京亚太肝病诊疗技术联盟主办的一本开放获取型国际期刊。期刊主编由成军教授和李连勇教授共同担任。期刊还特邀一批国内外著名胃肠病学专家、消化内镜学专家担任编委和顾问,具有较高的学术水准。
Gastroenterology & Endoscopy覆盖消化系统疾病全领域、并关注消化内镜的临床研究 、诊断和内镜治疗最前沿的发展。期刊旨在提供有关胃肠病学、肝脏病学和消化内镜检查的最新临床研究和权威观点。
Gastroenterology & Endoscopy所有文章将经过严格的同行评审,一经收录将发表在月活用户超过1700万的ScienceDirect平台,供领域内的学者、及全球读者免费阅读、下载及引用。
目前,期刊已被ESCI、CAS、DOAJ、Scopus等重要数据库收录

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-1-13 13:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社