||
为什么不能相信人工智能写的科学综述?
人工智能工具正被吹捧为快速综述科学文献的手段。但根据当前工具远未达到主流应用的标准。
这个问题关系重大。系统综述和其他类型的证据综合为临床实践、公共卫生指导及影响整个群体的政策决策提供依据。若出现错误,可能会给患者带来虚假希望,或导致卫生系统将资金浪费在无效或不安全的干预措施上。
当前的人工智能模型通常通过复制人类进行系统性文献综述的分步流程来实现:从不同来源筛选合适的研究;提取相关数据进行分析;最后撰写报告。其核心目标是替代人工完成这些工作。
但系统性综述并非纯粹的计算任务。需要人类专家来定义有意义的综述问题、评估相关性、解读结果并理解临床或政策含义。人工智能模型的训练数据中很少能充分反映上下文和主观细微差别,且模型易产生幻觉——即编造信息——因此其输出需经人类专家验证。
此外,很少有人工智能模型是开源的,大多数都依赖于不透明的专有“黑匣子”流程。这意味着无法检查一种工具是否会不成比例地收集对一家制药公司有利的试验。
人工智能擅长的是始终如一地管理大量信息。人工智能擅长的另一个领域是真实性检测工作。 但目前还不能相信人工智能写的科学综述。
Nature 653, 983 (2026)
doi: https://doi.org/10.1038/d41586-026-01616-3
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-30 00:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社