博文

科学史中的教训：第十九章模型的暴政：从气候门到疫情预测

已有 2480 次阅读 2026-3-15 14:58 |个人分类:我思故我在|系统分类:观点评述

第十九章模型的暴政：从气候门到疫情预测

一、1998年的曲棍球杆：一个图表的诞生

1998年，迈克尔·曼、雷蒙德·布拉德利和马尔科姆·休斯在《自然》杂志发表了一篇论文，重建了北半球过去600年的温度变化。他们的方法新颖：结合树轮、冰芯、珊瑚、历史记录等多种"代理"数据，用主成分分析提取共同信号，填补仪器记录之前的空白。

结果是戏剧性的。图表显示：温度在1900年前相对稳定，20世纪突然急剧上升，形状像曲棍球杆——长柄的平稳，短头的上扬。这个"曲棍球杆"图表成为气候变化传播的标志性图像，出现在阿尔·戈尔的纪录片《难以忽视的真相》中，被政府间气候变化专门委员会（IPCC）报告采用，进入教科书和公众意识。

但质疑很快出现。2003年，加拿大统计学家斯蒂芬·麦肯泰尔和经济学家罗斯·麦基特里克尝试复现曼的研究。他们发现：主成分分析的特定方法（"短中心法"）对代理数据的选择敏感，如果去除某些树轮序列（特别是加利福尼亚的狐尾松），曲棍球杆形状消失，20世纪的升温显得不那么异常。

2006年，美国国会委托国家研究委员会（NRC）调查。NRC报告确认20世纪后期的升温是异常的，但批评曼的统计方法："更广泛的表述"（过去1000年而非600年）"没有得到充分证实"。2006-2007年，韦格曼报告（由国会统计学家委托）更严厉，指控曼的方法产生"误导性"结果，并暗示同行评议的失效。

曼和他的合作者辩护：他们的方法是标准的，结果是稳健的，其他独立重建（使用不同方法）也显示类似模式。但"气候门"事件在2009年爆发：黑客入侵东英吉利大学气候研究单位（CRU）的服务器，泄露数千封电子邮件。邮件显示科学家之间的私人交流——讨论如何处理困难数据、如何回应质疑者、如何控制期刊内容。

被引用的片段包括：" I've just completed Mike's Nature trick of adding in the real temps to each series for the last 20 years (ie from 1981 onwards) and from 1961 for Keith's to hide the decline "（"我刚刚完成了迈克的自然技巧，将实际温度添加到每个系列的最近20年……以隐藏下降"）。这里的"技巧"（trick）在科学语境中通常指"方法"而非"欺骗"，"隐藏下降"指处理树轮代理与仪器记录 diverge 的问题——树轮在1960年后不再反映温度上升，原因不明（"divergence problem"）。

但公众解读是欺诈。气候怀疑论者声称这证明了科学家操纵数据、压制异见、制造恐慌。独立调查（如英国议会的罗素调查、宾夕法尼亚州立大学的调查）最终洗清了欺诈指控，确认科学共识的完整性，但损害已经造成。"气候门"成为怀疑论者的 rallying cry，曲棍球杆成为"伪科学"的象征，气候科学的公信力长期受损。

二、不确定性的政治：从IPCC到公众

气候模型的核心挑战是不确定性的层级。最底层是数据不确定性：仪器记录的不完整、代理数据的噪声、空间覆盖的偏差。中间层是模型不确定性：物理过程的简化（如云的形成、海洋环流）、参数的选择（如气溶胶的冷却效应）、初始条件的敏感性。最上层是情景不确定性：未来排放取决于社会经济选择，无法被科学预测。

IPCC的处理方式是概率语言。例如，2007年AR4报告声明："全球平均气温上升很可能是由于观测到的人为温室气体浓度增加所致"——"很可能"（very likely）被定义为>90%概率。2013年AR5报告将这一置信度提高到"极可能"（extremely likely，>95%）。

但这种概率语言是认知的，而非频率的。它不是基于重复实验（气候无法被重复），而是基于专家判断、模型一致性、和物理理解。这种判断是合理的、透明的、经过同行评议的，但它不是传统科学意义上的"证明"。

公众理解是另一问题。媒体倾向于简化：从"很可能"到"确定"，从"温度上升"到"灾难 imminent"。怀疑论者则利用不确定性：如果科学家说"很可能"，那么"可能不"也是合理的；如果模型有参数不确定性，那么任何预测都是可疑的。这种不确定性的武器化——用科学的不确定性来否定科学结论——是气候政治的核心策略。

更深层的问题是模型的验证。气候模型预测未来，但未来尚未发生。它们可以被"后验验证"（hindcast）——模拟过去的气候，与观测比较——但过去的数据已经被用于模型开发，因此不是独立的测试。真正的独立验证需要等待数十年，但政策决策不能等待。

这种"验证的延迟"是所有复杂系统模型的特征：经济模型、流行病模型、生态系统模型。它们预测未来，但未来的反馈是延迟的、模糊的、有争议的。模型的"成功"或"失败"往往在政治语境中被判定，而非纯粹的科学标准。

三、2008年的崩溃：金融模型的失败

2008年全球金融危机提供了另一个模型失败的案例。金融机构使用复杂的数学模型——高斯 copula、风险价值（VaR）、布莱克-斯科尔斯期权定价——来评估和管理风险。这些模型基于历史数据，假设正态分布或已知分布，假设市场效率，假设相关性稳定。

危机揭示了模型的系统性盲区。房地产价格被假设为地理上独立，但实际上全国同步下跌；次级抵押贷款的风险被低估，因为历史数据显示低违约率（但历史数据来自房价上升期，而非下降期）；杠杆和衍生品的风险在网络中累积，但模型分析单个机构而非系统连接。

纳西姆·塔勒布在《黑天鹅》（2007）中预见了这种失败。他区分"可预测的风险"（正态分布，可保险）和"不可预测的不确定性"（肥尾分布，极端事件）。金融模型忽视了后者，因为它们基于历史数据，而历史数据不包含未来的极端事件——根据定义，极端事件是"未 precedented 的"。

危机后的回应是监管改革（如巴塞尔III、多德-弗兰克法案），但模型的核心问题未解决。金融机构继续使用VaR，尽管已知其缺陷；继续使用正态分布假设，尽管知道肥尾存在；继续使用历史相关性，尽管知道相关性在危机中崩溃。这是因为替代方案更难：非参数方法数据密集，情景分析主观，完全放弃量化风险是不可能的。

金融模型的失败与气候模型的挑战形成对比。气候模型是物理基础的，基于守恒定律和已知机制；金融模型是现象学的，基于统计拟合和历史相关性。物理模型在原理上更可靠，但在实践中同样面临不确定性和简化。两种模型都被过度自信所害：使用者将模型输出当作"预测"而非"情景"，将概率当作"事实"而非"判断"。

四、2020年的恐慌：疫情模型的权力

2020年3月，COVID-19大流行初期，帝国理工学院伦敦的尼尔·弗格森团队发布了一份报告。他们使用Agent-based模型（模拟个体行为）和SEIR模型（易感-暴露-感染-恢复），预测不同干预策略下的死亡数。关键发现：如果不采取行动，英国和美国可能有220万人和220万人死亡；如果采取"抑制"策略（封锁、社交距离），死亡数可降至数十万。

这份报告直接影响了政策。英国政府从"缓解"（追求群体免疫）转向"抑制"（封锁）；美国政府引用类似模型支持关闭决策。弗格森成为媒体常客，被称为"封锁教授"，他的模型成为"科学"对抗"病毒"的象征。

但质疑迅速出现。模型的代码最初未公开，经过压力后发布，被批评为混乱、未注释、充满硬编码参数。模型的假设——如住院率和死亡率——基于早期中国和意大利的数据，高度不确定。模型的敏感性分析显示，微小参数变化导致巨大结果差异。

2020年5月，弗格森因违反自己倡导的封锁规则（与情人会面）而辞职，这损害了模型的公信力，但科学争议继续。其他团队使用不同方法（如牛津大学的群体免疫模型）得出不同结论，预测更低的死亡数（如果感染广泛但无症状比例高）。这些模型之间的差异不是"正确 vs 错误"，而是假设的选择：病毒传播率、无症状比例、免疫持续时间，这些在2020年初都是未知的。

疫情的发展提供了实时验证。到2020年底，实际死亡数介于弗格森的最坏情景和牛津的乐观情景之间，但更接近弗格森的预测（尽管具体数字不同）。然而，这种"成功"是模糊的：政策干预改变了轨迹，因此无法知道"无干预"的 counterfactual；不同国家的差异（如瑞典的轻度干预 vs 新西兰的严格封锁）显示了政策的效果，但也显示了模型无法预测的社会文化因素。

更深层的问题是模型的政治使用。模型被引用为"科学说我们必须封锁"，但模型实际上说"如果假设X，则结果Y"。X的选择（病毒传播率、医疗系统容量、社会 compliance）是政治的，不是科学的。模型的权威性被用来去政治化决策，将艰难选择包装为技术必然。

这种"模型的暴政"——用模型输出替代民主审议——在疫情期间普遍。封锁的持续时间、学校关闭、经济支持，这些涉及价值权衡（生命 vs 生计、当前 vs 未来、平等 vs 效率），但被呈现为"遵循科学"。科学可以提供信息，但不能决定价值；模型可以预测后果，但不能选择接受哪些后果。

五、模型怀疑论：从合理质疑到否定主义

对模型的批评是健康的，但可能滑向模型否定主义——拒绝所有模型，拒绝量化预测，拒绝科学输入政策。这种否定主义在气候变化中常见（"模型不可靠，因此不行动"），在疫情期间也出现（"模型都错了，因此开放"）。

合理的怀疑与否定主义的区别在于标准的一致性。如果批评者要求气候模型达到物理实验的精度（不可能），但接受经济预测的不确定性（同样不可能），这是双重标准。如果批评者强调疫情模型的参数不确定性，但忽视不行动的风险（同样不确定），这是选择性怀疑。

模型否定主义的心理根源是对不确定性的不耐受。模型承认不确定性（通过概率、情景、敏感性分析），但这被解读为"不知道任何东西"。公众偏好确定的谎言（"没有风险"）而非诚实的概率（"10%风险"），即使后者更真实。

但模型使用者也贡献于这种不信任。过度自信的陈述（"科学说"）、未公开的方法（弗格森的初始代码）、政治化的解读（"模型证明我的政策"），都损害了模型的公信力。模型的权威性是借来的，来自科学的整体声誉，但这种借贷需要偿还——通过透明、谦逊、和错误时的承认。

六、模型素养：从使用者到公民

应对模型的暴政，需要模型素养——理解模型的能力、局限和适当使用。这种素养不仅是技术人员的，也是政策制定者和公众的。

对技术人员：承认模型的简化是选择性的，而非中性的。选择包括什么过程、忽略什么反馈、如何参数化，都嵌入价值判断。透明这些选择，进行敏感性分析，承认不确定性，是专业责任。

对政策制定者：模型是输入之一，而非决策的替代。模型预测后果，但不评估后果的可接受性。将模型输出与价值权衡分离，是民主决策的要求。

对公众：理解模型的概率语言。"很可能升温2度"不是"确定升温2度"，也不是"升温2度是好的或坏的"。理解模型的情景性质："如果排放继续，则……"不是预测，而是条件判断。

模型素养的教育是紧迫的。气候变化的公众理解、疫情的政策支持、技术的社会接受，都依赖于这种素养。但教育本身受模型影响：我们如何建模教育效果？如何评估素养提升？这些元问题显示了模型的无处不在。

七、教训：工具与神谕

气候门和疫情预测提供了关于科学模型的多重教训。

第一，模型是工具，不是神谕。它们简化现实以探索可能性，而非复制现实以预测未来。将模型当作"真相"是范畴错误，但将模型当作"虚构"也是错误。模型是有根据的推测，其价值在于比较情景、识别敏感参数、指导数据收集，而非提供确定答案。

第二，不确定性是信息，不是无知。模型的概率输出（"很可能"、"90%置信区间"）是知识的形式，而非知识的缺乏。拒绝不确定性（"我们不知道，因此不行动"）和过度自信（"我们知道，因此必须行动"）都是错误的。

第三，透明是信任的基础。弗格森的代码争议、气候邮件的泄露，都显示隐藏损害信任。模型的源代码、数据、假设文档应该公开，接受审查。这不是对科学家的不信任，而是对科学的信任——相信经得起审查。

第四，模型的政治使用是去政治化的策略。 "遵循科学"的口号将价值选择包装为技术必然，逃避民主责任。科学家应该提供"如果-则"的判断，政策制定者应该做"因此"的选择，公众应该参与"是否"的决定。

最后，所有模型都是错的，但有些有用。乔治·博克斯的这句名言是谦逊的，也是自信的。模型的有用性不在于正确，而在于比替代方案更好——比纯直觉、比意识形态、比拖延。在复杂系统面前，模型是不完美的工具，但放弃工具不是选择，而是另一种选择（通常更坏）。

尾声：曲棍球杆的幽灵

迈克尔·曼的曲棍球杆图表，在2020年代仍然是气候科学的象征，也是争议的对象。后续研究使用不同方法（如PAGES 2k网络的全球重建）确认了20世纪异常升温的核心发现，但细节有差异：中世纪暖期的存在、小冰期的幅度、代理数据的区域差异。

这些差异不是"曼错了"，而是科学的正常过程。知识是累积的、修正的、细化的。但曲棍球杆的符号化使其成为不可触碰的图腾或必须摧毁的目标，取决于政治立场。科学发现一旦进入公共领域，就获得独立生命，被用于未曾设想的用途。

在COVID-19的模型中，我们看到了类似的符号化。弗格森的220万死亡预测成为"封锁正当性"的象征，尽管实际政策是多种因素的结果，实际死亡数（即使高）也远低于无干预情景。模型被记住为"正确"或"错误"，而非"在假设X下预测Y"。

这种简化是认知的必然，也是政治的工具。公众需要简单的叙事（"科学家拯救了我们"或"科学家欺骗了我们"），但科学提供的是复杂的概率。模型素养的目标不是消除这种张力，而是管理它——承认简化的代价，保持对复杂性的警觉。

在曲棍球杆的上升曲线中，在弗格森的死亡预测中，在疫情模型的情景中，我们看见同一个幽灵：人类对确定性的渴望，对不确定性的恐惧，对工具的依赖和对工具的反抗。模型的暴政不是模型的错，而是我们使用模型的方式——将工具当作神谕，将概率当作命令，将科学当作政治的替代。

当我们学会与模型共处——使用它们，质疑它们，透明它们，但不崇拜或否定它们——我们是在实践一种成熟的科学文化。这种文化承认知识的局限，接受决策的风险，承担集体的责任。曲棍球杆和疫情模型是这种文化的试金石，它们的遗产将取决于我们如何回应。

本章注释与延伸阅读

曼等人的原始论文《Global-scale temperature patterns and climate forcing over the past six centuries》（1998）发表在Nature上。关于曲棍球杆争议，参见Michael E. Mann的《The Hockey Stick and the Climate Wars: Dispatches from the Front Lines》（2012）和Montford的《The Hockey Stick Illusion: Climategate and the Corruption of Science》（2010，怀疑论视角）。关于气候门调查，参见Russell等人的《The Independent Climate Change E-mails Review》（2010）。关于金融模型失败，参见Nassim Nicholas Taleb的《The Black Swan: The Impact of the Highly Improbable》（2007）和《Antifragile: Things That Gain from Disorder》（2012）。关于COVID-19模型，参见Neil Ferguson等人的《Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand》（2020）和后续批评如《Report 9: Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand》（2020）。关于模型素养，参见Eric Winsberg的《Philosophy and Climate Science》（2018）和《Science in the Age of Computer Simulation》（2010）。关于模型不确定性的一般讨论，参见Naomi Oreskes和Kerry Emanuel的《The Guardians of Science: The Role of Models in Scientific Research》（2023）。

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。
链接地址：https://blog.sciencenet.cn/blog-41701-1525841.html

上一篇：科学史中的教训：第十八章发表的暴政：p值操纵与可重复性危机
下一篇：科学史中的教训：第二十章女性的隐形：从罗西·富兰克林到吴健雄

欢迎参加科学网十佳博文评选活动！

主办单位：

支持单位：

收藏 IP: 111.27.171.*| 热度|

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

科学史中的教训：第十九章模型的暴政：从气候门到疫情预测

当前推荐数：10 推荐人：郑永军 刘进平 宁利中 杨正瓴 崔锦华 高宏 朱林 陈蕴真 尤明庆 刘跃

该博文允许注册用户评论请点击登录评论 (2 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

科学史中的教训：第十九章 模型的暴政：从气候门到疫情预测

当前推荐数：10 推荐人： 郑永军 刘进平 宁利中 杨正瓴 崔锦华 高宏 朱林 陈蕴真 尤明庆 刘跃

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

科学史中的教训：第十九章模型的暴政：从气候门到疫情预测

当前推荐数：10 推荐人：郑永军刘进平宁利中杨正瓴崔锦华高宏朱林陈蕴真尤明庆刘跃

该博文允许注册用户评论请点击登录评论 (2 个评论)