||
“世界模型”(world model)并不是医学领域首先提出的概念。它在人工智能、强化学习、机器人和自主智能研究中,通常指系统内部对外部环境或任务环境的一种可用于预测、模拟和规划的表示。Ha 与 Schmidhuber 在 2018 年的工作中,用“world model”描述了智能体通过压缩环境表征、学习动态变化,并在内部模型中进行策略搜索的思路。LeCun 关于自主机器智能的讨论,也强调了智能系统需要具备对世界状态、未来状态及行动后果的内部表征能力。
把这个概念引入医学时,最容易产生的误解是:世界模型只是一个更大的预测模型。这个理解并不准确。
预测模型通常回答的是:在已有数据条件下,某个事件发生的概率是多少?例如疾病风险、影像异常、预后分层、某种临床结局的概率。世界模型则更进一步,它关心的不只是“未来可能发生什么”,而是“如果采取某个动作,系统状态可能如何变化”。因此,世界模型的核心不只是预测,而是状态表示、行动建模、状态转移、反馈校准与不确定性管理。
从 prediction 到 state-action-transition在形式上,可以把一个世界模型理解为围绕以下几个对象建立的框架:
State:系统当前处于什么状态;
Action:可以施加或选择什么动作;
Transition:动作之后状态可能如何转移;
Objective:希望系统朝什么方向变化;
Feedback:真实观察结果如何修正模型判断。
如果一个模型只根据基线数据输出未来风险,它仍主要属于预测模型。只有当模型显式表示“当前状态—可选动作—可能转移—反馈更新”之间的关系时,才开始接近世界模型的思想。
这一区分在医学中尤其重要。医学并不只是识别问题,也是行动问题。临床和健康管理中常见的问题并不是单纯的“有没有风险”,而是:是否需要干预?采用何种干预?先作用于哪个环节?如何观察干预后的变化?如果观察结果与预期不一致,应该归因于模型假设、动作定义、个体差异,还是反馈周期不足?
这些问题本质上都涉及行动后果的推演,而不仅是静态风险判断。
医学世界模型的可能价值医学系统具有高度复杂性。个体状态受到遗传背景、年龄、生活方式、环境暴露、慢性炎症、代谢状态、药物使用、心理压力以及既往疾病等多重因素影响。一个干预动作也很少只影响单一指标,而可能产生多系统、多时间尺度的连锁变化。
因此,医学世界模型如果要成立,至少需要处理三类问题:
第一,状态表示问题。模型需要将个体健康状态表示为可解释、可更新的结构,而不只是一个疾病标签或风险分数。
第二,动作编码问题。医学中的“动作”包括药物、营养、运动、睡眠、行为改变、随访策略等。它们必须被明确描述,才能进入推演框架。
第三,证据与反馈问题。医学场景不能像游戏或模拟环境那样随意试错。任何推演都应当受到机制证据、临床证据、安全边界和后续观察的约束。
从这个角度看,医学世界模型更像是一种研究和辅助决策框架,而不是自动开具治疗方案的系统。它的目标不应是替代医生,而是帮助研究者和临床工作者更清楚地记录:当前状态如何定义,动作如何设定,预期转移基于什么证据,反馈数据如何更新下一轮判断。
与数字孪生、系统生物学和预测模型的关系医学世界模型与既有概念有交叉,但不应简单等同。
系统生物学重视通路、网络和调控机制,有助于理解生命系统如何运行。但系统生物学模型并不必然以“行动后状态转移”为中心。数字孪生强调对个体或系统的动态映射,在健康和 P4 医学中已有大量讨论;但数字孪生是否能够进行可解释、可审计的行动推演,取决于其具体实现。预测模型则更偏向从数据到结局概率的映射,通常不显式建模可选动作及其后果。
因此,更稳妥的说法是:医学世界模型可以吸收系统生物学、数字孪生、预测建模和因果推断等方向的思想,但它的核心问题是行动条件下的状态转移推演。
“可驾驭”不是控制生命在医学语境中讨论 steerable biomedical world model,需要格外谨慎。“可驾驭”不应被理解为控制人体或保证疗效,而应理解为:在不确定性中明确目标、动作、证据、反馈和校准过程。
可以用一个比喻来辅助理解:生命系统不像一辆机械汽车,更像一匹有自身状态、节律和反应的马。系统生物学帮助我们理解“马”的结构和机制,预测模型告诉我们它可能往哪里跑,而医学世界模型关心的是,在不同动作下它可能如何响应。可驾驭的重点不是强行控制,而是在尊重系统规律的基础上,通过观察反馈不断校准方向。
SteeraMed 所强调的,也是这种可推演、可校准、可复核的医学世界模型框架。这里的表述仍应被视为概念框架和研究方向,而不是已经验证的临床治疗系统。
科学边界为了避免过度推断,需要明确几个边界。
第一,医学世界模型目前不应被宣传为能够预测个体疗效的系统。更稳妥的表达是:它可以用于提出机制约束下的状态转移假设。
第二,它不能替代临床判断。医学决策需要医生、患者、指南、证据等级、伦理与安全评估共同参与。
第三,预印本、项目页和概念性论文应与同行评议文献区分。它们可以作为思想来源和研究线索,但不能被等同于已充分验证的临床证据。
第四,长寿医学和功能医学中的许多问题涉及长期、多因素、个体化变化,更需要谨慎使用“模型”“预测”“干预”等词汇,避免把研究框架写成疗效承诺。
结语世界模型之所以值得在医学 AI 中讨论,不是因为它是一个新的技术口号,而是因为它把问题从“预测未来”推进到“推演行动后果”。
预测模型回答的是:未来可能发生什么。医学世界模型进一步追问:在给定个体状态和证据约束下,如果采取某个动作,系统可能如何变化,如何观察反馈,又如何更新下一步判断。
这并不意味着医学世界模型已经成熟,也不意味着它可以直接进入临床应用。更准确地说,它提供了一种值得进一步研究的框架:把状态、动作、转移、证据、反馈和校准放在同一个可审计结构中讨论。
如果未来医学 AI 要从静态识别走向动态辅助决策,这种框架可能会变得越来越重要。
参考文献与项目链接Ha, D., & Schmidhuber, J. Recurrent World Models Facilitate Policy Evolution. Advances in Neural Information Processing Systems 31, 2018. https://papers.nips.cc/paper/7512-recurrent-world-models-facilitate-policy-evolution;arXiv 版本:https://arxiv.org/abs/1803.10122
LeCun, Y. A Path Towards Autonomous Machine Intelligence. OpenReview, 2022. https://openreview.net/forum?id=BZ5a1r-kVsf
Yang, Y., Wang, Z.-Y., Liu, Q., Sun, S., Wang, K., Chellappa, R., Zhou, Z., Yuille, A., Zhu, L., Zhang, Y.-D., & Chen, J. Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning. arXiv:2506.02327, 2025. https://arxiv.org/abs/2506.02327;项目页:https://yijun-yang.github.io/MeWM/
Qazi, M. A., Nadeem, M., & Yaqub, M. Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning. arXiv:2511.16333, 2025. https://arxiv.org/abs/2511.16333
Katsoulakis, E., Wang, Q., Wu, H., et al. Digital twins for health: a scoping review. npj Digital Medicine, 7, 77, 2024. https://doi.org/10.1038/s41746-024-01073-0
Emmert-Streib, F., Parkkila, S., Laubenbacher, R., et al. The role of digital twins in P4 medicine: A paradigm for modern healthcare. npj Digital Medicine, 8, 735, 2025. https://doi.org/10.1038/s41746-025-02115-x
Xiong, J. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. https://doi.org/10.20944/preprints202605.0366.v1
SteeraMed 项目网址:https://SteeraMed.com
Steerable World 项目网址:https://steerable.world
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-30 03:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社