博文

李德毅院士的认知物理学第五章画云的人：给不确定性画一张"肖像"

已有 959 次阅读 2026-5-26 08:51 |个人分类:我思故我在|系统分类:观点评述

第五章画云的人：给不确定性画一张"肖像" 一、气象台的"大概"

每天早上七点十五分，林薇会准时坐在省气象台的预报大厅里，面对六块拼接成弧形的显示屏。她的工作是向公众发布当日天气预报。但今天，她盯着屏幕上那团盘旋在本省上空的积雨云，手指悬在键盘上，迟迟敲不下去。

数值预报模型给出了明确的计算结果：今日午后，省城及周边地区有百分之三十的降水概率，降水量级为零到五毫米，局地可能出现短时强降水。

百分之三十。这个精确到个位数的数字，是超级计算机跑了三个小时、解算了数百万个网格点的大气运动方程后得出的。但林薇知道，当她把这个数字翻译成公众语言时，麻烦才刚刚开始。

如果她写"今日午后有百分之三十的降雨概率"，电话会被打爆——"百分之三十到底是下还是不下？我带不带伞？"如果她写"局地有短时阵雨"，有人会抱怨预报不准，因为城里没下而郊区下了。如果她写"多云转阴"，一旦下了雨，又会被指责隐瞒信息。

最终，她在发布稿上写了这样一句话："今日午后到傍晚，部分地区有分散性阵雨或雷雨，出门建议随身携带雨具。"

这是一个典型的中国式气象预报表述：模糊、留有余地、充满了"部分""分散性""或"这样的不确定性词汇。林薇松了一口气，但内心有一丝苦涩。她知道，自己用语言的模糊性，掩盖了数值的精确性；用人为的不确定性，替代了模型给出的确定数字。因为在她二十年的预报生涯中，她深刻领悟到一个真理：真实世界的不确定性，远不是百分之三十这个数字所能概括的。

那个百分之三十，只是大气系统在特定初始条件下的统计输出。但真实的大气是活的：一阵突如其来的山谷风可能把云吹散，城市热岛效应可能在局部触发对流，一架刚刚降落的飞机尾流可能在无意中成为凝结核。这些微观因素无法被模型完全捕捉，于是它们汇聚成一种不可还原的模糊性——不是随机性，而是认知的模糊性。林薇作为一个人类预报员，她的价值不在于重复计算机的数字，而在于用她二十年的经验，把这种认知模糊性翻译成了公众能够理解的生活语言。

这个场景每天都在世界各地上演。它揭示了一个被现代技术遮蔽的真相：人类生活在一个定性的世界里，却被迫用定量的语言去描述它。我们说"今天很热"，而不是"今日气温三十五点七摄氏度"；我们说"这个人很年轻"，而不是"此人年龄二十四岁三个月零八天"；我们说"这段路很堵"，而不是"此路段平均车速每小时十二点三公里"。我们的认知天然是模糊的，但我们的科学训练却要求我们精确。

这种张力，正是李德毅院士提出"云模型"的出发点。他在多年的研究中发现，人工智能要真正理解人类，要真正融入人类的生活世界，必须首先学会处理这种无处不在的定性概念。不是把定性强行转化为定量，而是让机器像人一样，能够用"云状"的边界去把握世界。

二、精确的暴政

人类对精确的迷恋，几乎与文明同龄。

古希腊的毕达哥拉斯学派相信，万物皆数，宇宙的和谐在于数学比例的精确。他们发现了勾股定理，却也发现了无理数——那个无法用两个整数之比表达的、无限不循环的√2。据说，毕达哥拉斯的学生希帕索斯因为公开了这个发现，被同伴抛入大海。这个传说无论真假，都象征性地揭示了一种深层的文化焦虑：精确是好的，模糊是危险的；可度量的是理性的，不可度量的是蒙昧的。

这种焦虑在近代科学中达到了顶峰。伽利略说，自然之书是用数学语言写成的。牛顿用微积分精确描述了天体运动。拉普拉斯甚至宣称，只要知道宇宙中所有粒子的初始位置和速度，就能推算出过去和未来的全部历史。这是一个决定论的宏伟梦想：宇宙像一座巨大的钟表，精确、确定、可预测。

这个梦想塑造了现代技术的面貌。计算机是精确的极致体现：晶体管要么开要么关，没有"差不多开"的状态；浮点数可以精确到小数点后几十位；算法按照严格的逻辑门运行，不允许任何模棱两可。我们建造了一座精确的殿堂，然后把真实世界的不确定性和模糊性，当作需要被清除的"噪声"或"误差"。

但李德毅在爱丁堡研究船舶避碰时，就敏锐地察觉到了这种"精确暴政"的局限。北海上的船长们，面对浓雾中的来船，不可能做精确的三角测量和概率计算。他们说"对方大概在左前方""距离估计两三海里""看起来速度不快"——这些表述在当时的工程系统中是无法被处理的。工程师们要求的是：方位角多少度？距离多少米？速度多少节？误差范围多少？

"当我问一位老船长，他是如何在雾中判断碰撞风险的，"李德毅后来回忆，"他说：'感觉。'这个'感觉'不是神秘主义，而是数十年经验在大脑中沉淀出的模糊模式。他能从雷达回波的微弱变化、从船体轻微的震动、从无线电里对方声音的语调，综合出一种'态势感'。这种感觉无法被拆解成精确的参数，但它往往是正确的。"

这正是人类认知的常态。我们不是在精确计算中生存，而是在模糊判断中前行。一位母亲不需要测量婴儿体温的精确数值，就能凭额头的触感判断"有点发烧"；一位厨师不需要称量每一粒盐，就能凭手感知道"差不多够了"；一位老司机不需要测量与前车的精确距离，就能凭直觉知道"跟得太近了"。

如果人工智能只能处理精确的数字，而不能处理这些"有点""差不多""太"的定性概念，那么它永远只能徘徊在人类生活世界的边缘，做一个高效的计算器，而不是一个真正的认知伙伴。

李德毅意识到，必须找到一种方法，让机器能够形式化地处理模糊性。不是消除模糊，而是表达模糊；不是回避不确定，而是度量不确定。这个方法的灵感，最终来自天空中的云。

三、画云的人

云，是自然界最模糊又最清晰的存在。

站在地面上仰望，一朵云有大致的形状：像马、像山、像棉花糖。但它没有锐利的边界。你不可能指着天边说"云的边缘就在这里，左边是云，右边不是云"——因为云的边界是渐变的、渗透的、随时间流动的。然而，尽管边界模糊，云依然是一个可以被识别、被命名、被谈论的概念。气象学家会说"积雨云""层积云""卷云"，普通人会说"乌云""白云""彩云"。我们共享着关于"云"的模糊概念，并在日常生活中毫无障碍地使用它。

李德毅问了一个关键的问题：我们能否用数学的语言，画出概念的"云"？

传统的数学对此束手无策。集合论要求一个元素要么属于某个集合，要么不属于，没有中间状态。概率论处理的是随机性——事件发生了没有，我不知道，但它要么发生要么不发生。但"青年"这个概念呢？一个人十八岁是青年，二十八岁是不是？三十八岁呢？四十八岁呢？在某个神奇的生日零点，一个人突然从"青年"变成"非青年"吗？显然荒谬。真实世界的概念边界，像云一样渐变的、重叠的、情境依赖的。

云模型的核心思想，是用三个数字来"锚定"一个模糊概念的"云状"肖像。李德毅给这三个数字取了名字：期望、熵、超熵。让我们抛开数学符号，只用比喻来理解它们。

期望，是云最浓的地方，是概念的中心，是当你听到这个词时脑海中浮现的最典型样本。说到"高个子"，你首先想到的可能是一米八五的人——这就是期望。它不是平均值，不是中位数，而是认知原型，是那个在模糊集合中最具代表性的点。

熵，是云的胖瘦，是概念的模糊范围，是边界的不确定性。如果"高个子"的熵很小，那意味着这个概念很精确，可能只有一米八三到一米八七之间的人才算高个子；如果熵很大，那意味着从一米七五到一米九五的人都可能被不同程度地认为是高个子。熵越大，云越胖，边界越模糊。

超熵，是云的不规则程度，是模糊边界本身的抖动。有些概念，虽然整体模糊，但边界相对稳定——比如"成年人"，各国法律有明确的年龄界定，尽管生物学上青春期有跨度。有些概念，边界本身就在不断晃动——比如"时髦"，今年时髦的东西明年就过时，它的云不仅胖，而且形状多变，中心漂移。超熵捕捉的，正是这种边界的不稳定性。

这三个数字像三根支柱，撑起了一片概念的"云"。在这片云里，任何一个具体的数值——比如一个人的身高、今天的温度、一段路的拥堵程度——都可以找到它"属于"这个概念的隶属度。这个隶属度不是零或一，而是零到一之间的一个数，就像真正的云朵，有核心（隶属度接近一），有边缘（隶属度接近零），有过渡（隶属度在零到一之间渐变）。

这是一种革命性的思路。它不再强迫自然去适应数学的精确性，而是让数学去适应自然的模糊性。它承认，人类的认知本质上是在灰度中进行的，而不是在黑白中跳跃的。

李德毅把这个模型称为"云模型"，既是对天空中云的致敬，也是对这种认知特性的隐喻。他说："云模型不是要让世界变模糊，而是要承认世界本来就是模糊的。我们的任务不是消除模糊，而是给模糊画一张肖像，让它可以被计算、被处理、被机器理解。"

四、生活的云图

让我们用云模型的眼光，重新审视日常生活中那些最熟悉的概念。

"温暖"

冬天里，有人说"今天很温暖"。多少度算温暖？在哈尔滨，零下五度可能就被认为是"温暖"（因为比零下二十度暖和多了）；在广州，十度可能就被认为是"寒冷"。云模型说，"温暖"这个概念没有绝对的边界，它有三个参数：期望（最典型温暖的温度）、熵（温暖概念覆盖的温度范围）、超熵（这个范围随季节、地域、个人体质的漂移）。同一个温度，在不同的"云"里，隶属度完全不同。这不是相对主义，而是认知物理学：概念的意义依赖于情境结构。

"青年"

联合国说十五到二十四岁是青年，世界卫生组织说十四到四十四岁，中国共青团说十四到二十八岁。这些精确的数字边界，在云模型看来都是人为的切割。真实的"青年"是一朵云：期望可能在二十五岁左右，熵很大（从十几岁到三十几岁都可能被认为是青年），超熵受文化影响（在强调年轻化的社会里，青年的上限被压低；在老龄化社会里，青年的上限被抬高）。一个三十五岁的程序员在相亲市场上可能被认为"不再年轻"，但在创业投资圈可能被认为"正值青年"——同一个硬数据，在不同的软构体云里，映射出不同的隶属度。

"拥堵"

这是智能驾驶中最关键的概念之一。传统方法用一个速度阈值来定义拥堵：车速低于每小时二十公里就是拥堵。但真实驾驶中，拥堵是情境化的。凌晨三点的高速公路上，车速四十公里可能就被司机认为是"拥堵"（因为平时可以开一百二十公里）；而早高峰的城市主干道，车速二十公里可能反而被认为是"畅通"（因为平时只能开五公里）。云模型把"拥堵"画成一朵云：期望（最典型的拥堵状态）、熵（拥堵与畅通的过渡带有多宽）、超熵（不同城市、不同道路、不同时间下的漂移）。机器驾驶脑理解了这朵云，就能像人类司机一样，在"有点堵""还行""堵死了"之间做出符合情境的判断。

"差不多"

这可能是中文里最常用的模糊词。老厨师说"盐差不多够了"，老裁缝说"尺寸差不多合适"，老工匠说"力度差不多到位"。云模型可以捕捉"差不多"的微妙结构：它围绕某个期望值形成一个窄云（"差不多"意味着离目标不远），但云的边界是柔性的（允许一定的偏差），而且超熵很小（"差不多"的容忍范围通常是稳定的，由行业经验决定）。当机器学会了"差不多"，它就能在精密装配中处理"过盈配合"的微小偏差，在医疗诊断中处理"疑似"的灰色地带，在社交对话中理解"还行吧"背后的真实态度。

"美"

这是最极端的例子。美有标准吗？黄金分割、对称性、健康指标，都只能部分解释美。云模型不试图定义美，而是描述美在认知中的分布：期望（特定文化中最典型的美）、熵（美的范围有多宽——有的文化美很窄，如唐代以胖为美；有的文化美很宽，如现代多元审美）、超熵（美的标准随时代漂移的速度）。人工智能在图像生成中常常制造出"恐怖谷"效应——过于完美反而不像真人——正是因为它把美的概念处理成了一个过于狭窄的精确区间，而不是一朵有厚度、有渐变、有呼吸感的云。

这些例子揭示了一个深刻的道理：人类的语言不是对世界的精确标注，而是对世界的云状感知。每一个形容词，每一个程度副词，每一个定性概念，都是一朵飘浮在认知天空中的云。它们有中心，有边缘，有厚度，有漂移。我们使用这些概念时，不是在执行集合论的成员判定，而是在进行模式匹配——把眼前的具体对象，投射到我们脑中那朵概念之云上，看它落在云的哪个位置。

云模型的价值，就在于它给了机器一种类似人类的模式匹配能力。不是非此即彼的分类，而是亦此亦彼的渐变认知；不是一刀切的边界，而是有厚度的过渡带；不是静止的定义，而是随情境漂移的动态肖像。

五、从炮兵阵地到智能交通

云模型不是书斋里的数学游戏，它诞生于真实的工程需求，又在真实的工程实践中不断磨砺。

李德毅最早将模糊数学的思想应用于炮兵射击指挥系统。在传统的炮兵作战中，射击诸元的计算要求精确：目标距离、风速、温度、气压、弹药初速，每一个参数都要测量，每一个误差都要修正。但战场是混沌的：目标可能在移动，烟雾可能遮蔽观察，通信可能中断，测量设备可能有系统偏差。指挥官在实战中常常面临一个困境：是等待更精确的测量（可能错失战机），还是依据现有不精确的信息立即射击？

李德毅引入的模糊处理方法，让系统能够表达和处理"目标大概在某某区域""风速估计三到五级""射击效果可能覆盖目标"这样的定性信息。云模型在这里发挥了关键作用：把"覆盖目标"这个概念画成一朵云，中心是"直接命中"，边缘是"有效杀伤范围"，超熵反映了战场环境的不稳定性。指挥官可以直观地看到，在当前信息条件下，射击的"期望效果"在哪里，"不确定性"有多大，从而做出更符合战场直觉的决策。

这个早期实践奠定了云模型的工程哲学：不确定性不是需要被消灭的敌人，而是需要被管理的资源。承认不确定性，反而能够获得更鲁棒的决策。一个考虑了风速模糊性的射击方案，在真实风况偏离预期时，表现往往优于一个基于精确风速假定的方案——因为后者在假定失效时会彻底崩溃，而前者从一开始就为偏差预留了空间。

多年后，当李德毅转向智能驾驶研究时，云模型再次成为核心工具。城市交通中的"拥堵""危险""安全距离""合理车速"，无一不是定性概念。传统自动驾驶系统用精确的阈值来处理这些概念：车速低于二十公里就判定拥堵，距离小于两米就判定危险。这种精确性在实验室里看起来很美，但在真实道路上却屡屡碰壁。

因为真实的驾驶认知是云状的。同样是两米的距离，在高速公路上是极度危险（因为相对速度大），在拥堵的停车场里是正常状态（因为车速极低）。同样是二十公里的时速，在雨夜的山路上是过快，在晴天的城市支路上是过慢。云模型让"驾驶脑"能够为每一个定性概念建立动态的云肖像：根据当前的道路类型、天气条件、交通密度、甚至驾驶者的风格，调整那朵云的期望、熵和超熵。

李德毅团队曾做过一个有趣的实验。他们让搭载传统精确阈值算法的车辆和搭载云模型的车辆，在同一段复杂城市道路上行驶。传统车辆像一个紧张的新手司机：因为前方出现一个缓慢骑行的自行车，它在距离五十米时就开始减速，导致后车不满；因为右侧车道有一辆大车"似乎"要变道，它过度保守地刹车，造成不必要的拥堵。而搭载云模型的车辆，像一个经验丰富的老司机：它把"潜在危险"画成一朵云，根据骑车人的姿态、大车的轮向、周围车辆的反应，综合判断危险的隶属度。结果，云模型车辆不仅行驶更平稳，而且安全性指标更高——因为它避免了过度反应引发的次生风险。

这个实验揭示了一个反直觉的结论：在认知中，模糊可以比精确更准确。当你试图用精确的数字去切割流动的现实时，你得到的往往是僵化的错误。当你用模糊的云去拥抱流动的现实时，你反而能够捕捉到它的动态本质。

六、拥抱模糊：不确定性的美学

云模型的提出，在更深的层面上，是对现代科学世界观的一种修正。

自牛顿以来，科学追求的是一种"上帝视角"的确定性：拉普拉斯妖知道一切，宇宙像钟表一样运行。但二十世纪的物理学，两次从根本上动摇了这种确定性。量子力学告诉我们，微观粒子的状态在测量前是概率性的，不确定性不是无知，而是自然的内禀属性。混沌理论告诉我们，确定性方程可以产生不可预测的行为，初始条件的微小差异会被指数级放大，长期预测在原则上是不可能的。

认知物理学继承了这种对不确定性的尊重，但把它从物理学的微观世界和数学的抽象世界，带到了日常生活的宏观世界。它说，不仅电子的位置是模糊的，我们对"温暖"的感觉也是模糊的；不仅天气系统是混沌的，我们对"青年"的判断也是混沌的。这种模糊不是科学的失败，而是科学的对象本身具有的性质。

在这个意义上，云模型是一种认知的量子力学。就像量子力学用波函数描述粒子的概率分布，云模型用"云"描述概念的概率分布。波函数在测量时坍缩，云模型在应用时聚焦：当你真正需要对一个具体对象做出"是或否"的判决时（比如，这个人是否达到了参军年龄），云可以暂时收缩为一个精确的边界。但在大多数认知情境中，保持云的开放性和流动性，是更忠实于世界本相的选择。

李德毅常说，中国文化对模糊性有着天然的亲近。中国画讲究"墨分五色"，一笔下去，浓淡干湿，边界氤氲；中国音乐讲究"韵"，音符之间的滑音和留白，比音符本身更重要；中国哲学讲究"道可道，非常道"，最高的真理不可被精确言说。云模型在某种程度上，是用现代数学语言重新表达了这种东方智慧：不是非此即彼的二元对立，而是亦此亦彼的辩证统一；不是清晰的边界，而是有厚度的过渡；不是静止的定义，而是流动的生成。

但这绝不意味着云模型是反科学的。恰恰相反，它是更高级的科学精确——精确地描述不精确，形式化地处理非形式化，用数学的语言说出"不可言说之物"。就像热力学用"熵"精确地描述混乱，信息论用"比特"精确地描述信息量，云模型用"期望、熵、超熵"精确地描述模糊。这是一种元精确，是对精确本身的超越和扬弃。

在艺术领域，这种"精确地描述模糊"有着惊人的共鸣。印象派画家莫奈画鲁昂大教堂，不画教堂的石块和拱门，而画特定时刻的光线如何在教堂表面形成一片色彩的"云"。观者站在适当的距离，模糊的色彩点突然"涌现"为坚实的建筑——这不是视觉错觉，而是人类认知系统天然具有的云状整合能力。中国水墨画的"泼墨"，更是直接把"云"作为形式语言：一滴墨落在宣纸上，水与墨的渗透形成随机的边界，画家无法控制每一处细节，却能控制整体的"势"和"韵"。

云模型告诉我们，机器要理解人类，必须学会欣赏这种模糊的美学。它必须知道，当人类说"今天有点闷"时，不是在报告一个气象参数，而是在表达一种身体与环境的整体耦合状态；当人类说"你人真好"时，不是在做一个道德评分，而是在释放一种社交情感的云状信号；当人类说"差不多行了"时，不是在表达精确的中止条件，而是在划定一个弹性的容忍区间。

这种理解能力，是当前大语言模型所欠缺的。ChatGPT可以流畅地使用"有点""差不多""大概"，但它对这些词的把握是统计性的——它知道这些词经常出现在哪些语境中，却不知道这些词背后的云状认知结构。它可以模仿模糊的语言形式，却没有内化模糊的认知实质。就像一个学会了所有绘画技法的学徒，能够精确复制莫奈的笔触，却从未真正看过鲁昂大教堂在晨光中的样子。

七、云的边界与无限

云模型还有一个深刻的哲学意涵：它重新定义了"概念"的本质。

在传统逻辑中，概念是边界清晰的容器：A与非A泾渭分明，排中律不可违背。但在云模型中，概念是有厚度的场，边界是渐变的区域，A与非A之间存在广阔的灰色地带。这不仅是一个技术问题，它触及了人类认知的根本特性：我们是在关系中理解事物的，而不是在孤立中定义事物的。

"高"只有在与"矮"的关系中才有意义，"温暖"只有在与"寒冷"的对比中才被感知，"青年"只有在与"少年"和"中年"的过渡中才被识别。云模型天然地捕捉了这种关系性：每一朵云都飘浮在概念的空间里，与其他云相互重叠、相互渗透。在"青年"这朵云的边缘，它与"少年"的云交融，也与"中年"的云接壤。没有绝对的边界，只有相对的隶属度。

这种关系性暗示着，认知系统对世界的把握，不是通过建立一堵堵隔离的墙（精确分类），而是通过编织一张张重叠的网（模糊关联）。这正是人类大脑的工作方式：当我们想到"苹果"时，我们同时激活了"水果""红色""甜脆""牛顿""手机"等多个概念云，这些云在我们的工作记忆中重叠，形成瞬间的意义网络。云模型为这种神经层面的重叠现象，提供了形式化的表达工具。

李德毅展望，未来的认知机器不应该是一个巨大的精确分类器，而应该是一个概念的星云。每一个输入的刺激——无论是视觉的、听觉的、还是语言的——都会在这片星云中激起涟漪，激活多朵概念云，形成动态的、情境化的意义建构。这种机器不会给出"这是猫"的绝对判断，而是会给出"这 seventy percent 像猫，twenty percent 像狐狸，ten percent 像一团毛球"的云状描述——然后，根据后续的情境信息，不断调整这些云的权重和形状。

这听起来像是效率低下的。精确分类不是更快吗？在结构化的、封闭的领域里，是的。但在开放的、复杂的、充满未知的世界里，云状认知是更鲁棒的、更灵活的、更接近生命本质的。生物进化没有选择精确计算，而选择了模糊感知，正是因为后者更适合在不确定的环境中生存。一只鹿听到草丛中的响动，不会精确计算"这是狮子还是风"，而是迅速激活"危险"的云，做出逃跑决策。这种基于模糊的认知策略，在数百万年的自然选择中被证明是有效的。

云模型因此架起了一座桥：从生物认知到机器认知，从东方智慧到西方科学，从定性描述到定量形式，从日常语言到数学语言。它让李德毅的认知物理学，不再只是抽象的哲学构想，而成为了可以操作、可以计算、可以工程化的科学工具。

在国家气象台的预报大厅里，林薇不知道什么是云模型。但她每天的工作——把超级计算机的精确数字，翻译成公众能够理解的模糊语言——恰恰是云模型在人类社会中的活态运行。她是云的解读者，也是云的创造者。当她写下"部分地区有分散性阵雨"时，她实际上是在用自然语言画一朵云：期望（部分地区）、熵（分散性）、超熵（随局地条件变化）。

如果机器也能像她一样画云，那么人工智能就跨过了一道重要的门槛：从处理精确的数据，到理解模糊的世界；从模仿人类的行为，到共享人类的认知。

而在下一章，我们将看到，这种云状认知如何被组织成更复杂的模式。我们将遇见认知的四种面孔：记忆驱动的经验、知识驱动的推理、联想驱动的创造、假说驱动的发现。它们像四种不同的乐器，在云模型的管弦乐中，各自演奏着不可替代的声部。我们将理解，为什么老司机的经验、医生的诊断、诗人的灵感、科学家的洞见，虽然表现形式迥异，却都遵循着同一种四要素的语法。

窗外的天空飘过了一朵真正的云。它没有精确的几何形状，没有锐利的边缘，但它承载着雨的可能性，遮蔽着阳光的强度，改变着地面的温度。它是模糊的，它是真实的，它是活的。而认知物理学，正在教会机器如何去"看"这样一朵云——不是用传感器的精度，而是用认知的厚度。