博文

什么是世界模型？为什么它不只是一个预测模型

已有 881 次阅读 2026-5-20 23:04 |个人分类:世界模型|系统分类:科研笔记

什么是世界模型？为什么它不只是一个预测模型

“世界模型”（world model）并不是医学领域首先提出的概念。它在人工智能、强化学习、机器人和自主智能研究中，通常指系统内部对外部环境或任务环境的一种可用于预测、模拟和规划的表示。Ha 与 Schmidhuber 在 2018 年的工作中，用“world model”描述了智能体通过压缩环境表征、学习动态变化，并在内部模型中进行策略搜索的思路。LeCun 关于自主机器智能的讨论，也强调了智能系统需要具备对世界状态、未来状态及行动后果的内部表征能力。

把这个概念引入医学时，最容易产生的误解是：世界模型只是一个更大的预测模型。这个理解并不准确。

预测模型通常回答的是：在已有数据条件下，某个事件发生的概率是多少？例如疾病风险、影像异常、预后分层、某种临床结局的概率。世界模型则更进一步，它关心的不只是“未来可能发生什么”，而是“如果采取某个动作，系统状态可能如何变化”。因此，世界模型的核心不只是预测，而是状态表示、行动建模、状态转移、反馈校准与不确定性管理。

从 prediction 到 state-action-transition

在形式上，可以把一个世界模型理解为围绕以下几个对象建立的框架：

State：系统当前处于什么状态；
Action：可以施加或选择什么动作；
Transition：动作之后状态可能如何转移；
Objective：希望系统朝什么方向变化；
Feedback：真实观察结果如何修正模型判断。

如果一个模型只根据基线数据输出未来风险，它仍主要属于预测模型。只有当模型显式表示“当前状态—可选动作—可能转移—反馈更新”之间的关系时，才开始接近世界模型的思想。

这一区分在医学中尤其重要。医学并不只是识别问题，也是行动问题。临床和健康管理中常见的问题并不是单纯的“有没有风险”，而是：是否需要干预？采用何种干预？先作用于哪个环节？如何观察干预后的变化？如果观察结果与预期不一致，应该归因于模型假设、动作定义、个体差异，还是反馈周期不足？

这些问题本质上都涉及行动后果的推演，而不仅是静态风险判断。

医学世界模型的可能价值

医学系统具有高度复杂性。个体状态受到遗传背景、年龄、生活方式、环境暴露、慢性炎症、代谢状态、药物使用、心理压力以及既往疾病等多重因素影响。一个干预动作也很少只影响单一指标，而可能产生多系统、多时间尺度的连锁变化。

因此，医学世界模型如果要成立，至少需要处理三类问题：

第一，状态表示问题。模型需要将个体健康状态表示为可解释、可更新的结构，而不只是一个疾病标签或风险分数。

第二，动作编码问题。医学中的“动作”包括药物、营养、运动、睡眠、行为改变、随访策略等。它们必须被明确描述，才能进入推演框架。

第三，证据与反馈问题。医学场景不能像游戏或模拟环境那样随意试错。任何推演都应当受到机制证据、临床证据、安全边界和后续观察的约束。

从这个角度看，医学世界模型更像是一种研究和辅助决策框架，而不是自动开具治疗方案的系统。它的目标不应是替代医生，而是帮助研究者和临床工作者更清楚地记录：当前状态如何定义，动作如何设定，预期转移基于什么证据，反馈数据如何更新下一轮判断。

与数字孪生、系统生物学和预测模型的关系

医学世界模型与既有概念有交叉，但不应简单等同。

系统生物学重视通路、网络和调控机制，有助于理解生命系统如何运行。但系统生物学模型并不必然以“行动后状态转移”为中心。数字孪生强调对个体或系统的动态映射，在健康和 P4 医学中已有大量讨论；但数字孪生是否能够进行可解释、可审计的行动推演，取决于其具体实现。预测模型则更偏向从数据到结局概率的映射，通常不显式建模可选动作及其后果。

因此，更稳妥的说法是：医学世界模型可以吸收系统生物学、数字孪生、预测建模和因果推断等方向的思想，但它的核心问题是行动条件下的状态转移推演。

“可驾驭”不是控制生命

在医学语境中讨论 steerable biomedical world model，需要格外谨慎。“可驾驭”不应被理解为控制人体或保证疗效，而应理解为：在不确定性中明确目标、动作、证据、反馈和校准过程。

可以用一个比喻来辅助理解：生命系统不像一辆机械汽车，更像一匹有自身状态、节律和反应的马。系统生物学帮助我们理解“马”的结构和机制，预测模型告诉我们它可能往哪里跑，而医学世界模型关心的是，在不同动作下它可能如何响应。可驾驭的重点不是强行控制，而是在尊重系统规律的基础上，通过观察反馈不断校准方向。

SteeraMed 所强调的，也是这种可推演、可校准、可复核的医学世界模型框架。这里的表述仍应被视为概念框架和研究方向，而不是已经验证的临床治疗系统。

科学边界

为了避免过度推断，需要明确几个边界。

第一，医学世界模型目前不应被宣传为能够预测个体疗效的系统。更稳妥的表达是：它可以用于提出机制约束下的状态转移假设。

第二，它不能替代临床判断。医学决策需要医生、患者、指南、证据等级、伦理与安全评估共同参与。

第三，预印本、项目页和概念性论文应与同行评议文献区分。它们可以作为思想来源和研究线索，但不能被等同于已充分验证的临床证据。

第四，长寿医学和功能医学中的许多问题涉及长期、多因素、个体化变化，更需要谨慎使用“模型”“预测”“干预”等词汇，避免把研究框架写成疗效承诺。

结语

世界模型之所以值得在医学 AI 中讨论，不是因为它是一个新的技术口号，而是因为它把问题从“预测未来”推进到“推演行动后果”。

预测模型回答的是：未来可能发生什么。医学世界模型进一步追问：在给定个体状态和证据约束下，如果采取某个动作，系统可能如何变化，如何观察反馈，又如何更新下一步判断。

这并不意味着医学世界模型已经成熟，也不意味着它可以直接进入临床应用。更准确地说，它提供了一种值得进一步研究的框架：把状态、动作、转移、证据、反馈和校准放在同一个可审计结构中讨论。

如果未来医学 AI 要从静态识别走向动态辅助决策，这种框架可能会变得越来越重要。

参考文献与项目链接

Ha, D., & Schmidhuber, J. Recurrent World Models Facilitate Policy Evolution. Advances in Neural Information Processing Systems 31, 2018. https://papers.nips.cc/paper/7512-recurrent-world-models-facilitate-policy-evolution；arXiv 版本：https://arxiv.org/abs/1803.10122
LeCun, Y. A Path Towards Autonomous Machine Intelligence. OpenReview, 2022. https://openreview.net/forum?id=BZ5a1r-kVsf
Yang, Y., Wang, Z.-Y., Liu, Q., Sun, S., Wang, K., Chellappa, R., Zhou, Z., Yuille, A., Zhu, L., Zhang, Y.-D., & Chen, J. Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning. arXiv:2506.02327, 2025. https://arxiv.org/abs/2506.02327；项目页：https://yijun-yang.github.io/MeWM/
Qazi, M. A., Nadeem, M., & Yaqub, M. Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning. arXiv:2511.16333, 2025. https://arxiv.org/abs/2511.16333
Katsoulakis, E., Wang, Q., Wu, H., et al. Digital twins for health: a scoping review. npj Digital Medicine, 7, 77, 2024. https://doi.org/10.1038/s41746-024-01073-0
Emmert-Streib, F., Parkkila, S., Laubenbacher, R., et al. The role of digital twins in P4 medicine: A paradigm for modern healthcare. npj Digital Medicine, 8, 735, 2025. https://doi.org/10.1038/s41746-025-02115-x
Xiong, J. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. https://doi.org/10.20944/preprints202605.0366.v1
SteeraMed 项目网址：https://SteeraMed.com
Steerable World 项目网址：https://steerable.world