||
第二章 跨界者:一位控制论院士的"物理学乡愁"
一、爱丁堡的雾与无线电波
1980年深秋,苏格兰爱丁堡的晨雾像一匹巨大的灰色绸缎,从亚瑟王座山的方向缓缓铺展下来,把整个老城裹进湿润的沉默里。卡尔顿山下的街道上,路灯还亮着昏黄的光,一个三十六岁的中国男人夹着一摞图纸,快步穿过王子街花园。他的呢子大衣被风吹得猎猎作响,手里那卷画满波束指向图和概率曲线的图纸,边角已经被手指捏得发软。
这个男人叫李德毅。三年前,他还是中国东部某研究所里一名普通的无线电工程师,每天与雷达天线和短波频谱打交道。此刻,他是爱丁堡大学赫瑞瓦特学院的一名博士生,研究方向是"海上船舶避碰"——一个听起来极其工程化,却将在未来几十年里深刻影响他学术命运的课题。
爱丁堡的雾对李德毅有着特殊的意义。他后来回忆说,正是在那些浓得化不开的早晨,他第一次真切地感受到"不确定性"不是工程上的麻烦,而是世界本身的底色。在北海的航道上,两艘万吨巨轮在雾中相向而行,雷达屏幕上两个光点缓缓靠近。船长们面临的不是一个"是或否"的决策,而是一团模糊的、概率的、充满变数的判断:对方的航速是多少?雾会不会突然更浓?如果转向,会不会反而驶入另一条繁忙的航道?
"那时候我每天都在和'大概''也许''可能'打交道,"多年后,李德毅在一次面向青年学者的讲座中说道,"雷达能告诉你距离,但不能告诉你意图;仪器能测量速度,但不能测量风险。我开始怀疑,我们所受的传统工程训练——那种追求精确、确定、唯一的训练——是否足以描述真实世界的决策。"
这种怀疑在当时是离经叛道的。1980年代的中国工程界,刚从"差不多就行"的混乱年代走出来,对"精确"有着近乎宗教般的崇拜。计算机是新的神庙,算法是新的祷文,人们相信只要数据足够、模型够准,世界就会像钟表一样驯服。但李德毅在爱丁堡的海事实验室里,面对那些来自全球航运公司的真实事故报告,看到了另一个世界:一个由人的判断、环境的扰动、信息的残缺共同编织的混沌网络。
他的博士论文最终提出了一种基于模糊逻辑的船舶避碰模型。这不是当时学术界的主流选择。在爱丁堡大学的图书馆里,他翻阅了大量关于控制论和系统工程的书籍,其中一本泛黄的小册子给他留下了极深的印象——那是钱学森早年在美国参与编写的《工程控制论》的英译节选。书页边缘有人用铅笔批注着:"控制的艺术,不在于消除不确定性,而在于与不确定性共舞。"
这句话像一颗种子,埋进了李德毅的认知土壤。他后来常说,自己在爱丁堡最大的收获不是那张博士学位证书,而是一种"跨界"的视野:从无线电的硬件世界,跨入信息处理的软件世界;从工程技术的确定性王国,跨入人类决策的不确定性疆域。这种跨界不是简单的知识叠加,而是一种思维方式的基因重组。
博士论文答辩那天,爱丁堡罕见地出了太阳。答辩委员会的教授们对这个来自东方的学生既好奇又审慎。一位白发苍苍的老教授问:"李先生,您的模型里引入了太多'模糊'的东西,这让我们很难用传统的方法验证它。您如何保证这不是一种倒退——从科学退回到经验?"
李德毅没有直接回答。他走到窗前,指着远处福斯湾上缓缓移动的货轮说:"先生,您看那艘船。船长此刻做出的每一个决策,都是基于不完整的雷达回波、不精确的海流预报、不确定的对方意图。他没有时间做精确的积分运算,他必须'模糊地'、'大致地'判断。我的模型不是在追求精确,而是在模仿人类在不确定性中的生存智慧。这不是倒退,这是承认真实世界的复杂性。"
窗外,雾又起了。但那个年轻学者的话语,像一枚石子投入平静的湖面,涟漪将在未来数十年间不断扩散。
二、钱学森的"幽灵"与系统论的基因
回到中国后,李德毅的学术轨迹开始呈现出一种独特的"双螺旋"结构。一方面,他深入军队指挥自动化系统的研发,这是中国国防现代化的核心工程之一;另一方面,他始终没有放弃对"不确定性"和"认知"的理论追问。这两个看似遥远的领域,在他身上奇妙地交织在一起。
1980年代末的一个夏天,在北京西山脚下的一处国防科技研究院里,李德毅第一次见到了钱学森。那是一次小范围的学术座谈,主题是"系统工程与国防现代化"。钱学森已经年过七旬,但思维依然锐利如刀。当讨论到指挥自动化系统的架构时,钱学森突然打断了汇报者的技术细节,问了一个看似无关的问题:"你们这个系统,最后做决策的是机器还是人?如果是机器,它'懂'不懂战场态势?如果'不懂',那它只是一个更快的算盘。"
会议室里一片寂静。当时的指挥自动化系统本质上是一个信息高速公路:把前线的情报收集起来,传输到指挥中心,由参谋人员分析,再由指挥官决策。系统的"智能"体现在速度和容量上,而不是理解和判断上。钱学森的问题像一把锥子,刺破了那个时代对"自动化"的浅薄理解。
李德毅记得,钱学森在座谈中反复提到一个概念——"开放的复杂巨系统"。他说,人体是一个开放的复杂巨系统,社会是一个开放的复杂巨系统,战场更是一个开放的复杂巨系统。对付这种系统,不能靠还原论,不能指望把它拆成零件就能理解整体;必须用一种新的方法论,他后来称之为"从定性到定量的综合集成"。
"钱老当时说的话,我很多年后才真正理解,"李德毅后来回忆,"他不是在谈具体的技术,他是在谈一种科学哲学。他说,未来的智能系统,必须能够处理'意会知识'——就是那种老师傅带徒弟时'只能意会、不能言传'的知识。这让我震惊,因为这意味着人工智能不能只停留在书本知识和形式逻辑上,它必须能够进入人类认知的暗区。"
钱学森的"幽灵"——那种对宏大系统理论的执着、对跨学科融合的倡导、对"工程科学"定位的坚持——从此成为李德毅学术基因的一部分。他开始有意识地在工程实践和理论建构之间架设桥梁。在指挥自动化系统的研发中,他不像其他工程师那样只关注数据传输速率和数据库容量,而是反复追问:信息到了决策者手里,如何转化为"态势理解"?如何从一个"看数据"的系统,进化成一个"读态势"的系统?
这种追问在当时显得过于超前。1990年代的中国,互联网刚刚萌芽,人工智能还在经历第二次寒冬。大多数研究者关注的是专家系统、知识工程、逻辑推理——这些基于符号操作和明确规则的"硬"智能。李德毅却越来越被一种"软"智能所吸引:那种在模糊中把握整体、在不确定中做出决断、在信息不完备中形成信念的能力。
他开始系统研读控制论、信息论、系统论的"老三论",以及耗散结构理论、协同学、突变论的"新三论"。在这些理论的交汇处,他隐约看到了一幅更大的图景:认知不是大脑孤立的运算,而是物质、能量、信息在特定结构和时间序列上的组织形态。这个念头在当时还只是一团模糊的光,但它已经足以让李德毅与主流的人工智能研究路径产生微妙的偏离。
1995年,李德毅在一篇内部报告中首次提出了一个大胆的观点:"我们过去把人工智能等同于计算机科学,这是一个时代的局限。人工智能的本质是认知科学,而认知科学的根基在物理学。不是那种研究基本粒子的物理学,而是研究组织、结构、演化的物理学。"
这份报告在当时的学术圈里引起了不小的争议。有人批评他"不务正业",一个搞指挥自动化的工程师,凭什么对人工智能的根基指手画脚?也有人认为他"好高骛远",在神经网络都还没复兴的年代,谈什么"认知的物理学根基"?但李德毅并不辩解。他知道,一种原创性的思想在诞生之初,往往找不到现成的容身之所。它必须在自己的孤独中生长,直到足够强壮,能够抵御外界的质疑。
三、模糊世界的清晰者
如果说钱学森的"开放的复杂巨系统"给了李德毅宏观的视野,那么模糊数学则给了他微观的工具。在爱丁堡的海事研究之后,李德毅从未停止对"不确定性"的形式化探索。他深知,仅仅用语言描述不确定性是苍白的,必须找到一种数学的表达,让模糊的概念能够被计算、被处理、被机器所掌握。
1990年代中期,一个偶然的机会,李德毅接触到了气象学家对"云"的描述。在气象学中,"云"是一个极其模糊的概念:积雨云、层云、卷云,边界在哪里?一朵云从生成到消散,何时开始、何时结束?气象学家用"隶属度"的概念来处理这种模糊性——一个天气系统"属于"积雨云的程度,不是0或1,而是0到1之间的一个数。
这个灵感像一道闪电。李德毅意识到,人类语言中的绝大多数概念都是"云状"的。"青年"不是一个从十八岁生日零点零分开始、到三十五岁生日结束的精确区间;"温暖"也不是一个固定不变的温度阈值。这些概念有核心、有边缘、有不确定性,就像天空中的云朵,有大致的形状,却没有锐利的边界。
他开始构思一种"云模型"——不是气象学意义上的云,而是数学意义上的云,一种能够用数字刻画概念模糊性的形式化工具。这是一个极其艰难的过程。他要对抗的不仅是技术难题,更是整个时代的思维定势。在精确数学统治科学殿堂的时代,提出一种"不精确"的数学,无异于在欧几里得的圣殿里宣扬非欧几何。
"那时候很多人问我,云模型和概率论有什么区别?"李德毅后来在一次访谈中笑着说,"概率论处理的是随机性——事件发生了没有,我不知道,但它要么发生要么不发生。模糊性处理的是概念本身的边界——'这个人算不算高个子',这不是随机问题,这是认知问题。概率论是上帝掷骰子,模糊性是人类在分类时的犹豫。"
云模型的核心思想,是用三个数字来"锚定"一个模糊概念:期望——概念的中心值;熵——概念的不确定度;超熵——不确定度的波动程度。这三个数字像三根支柱,撑起了一片概念的"云"。在这片云里,一个数值"属于"这个概念的"隶属度"不再是固定的,而是像真正的云朵一样,有浓有淡,有核心有边缘。
这个模型后来成为认知物理学最重要的形式化工具之一。但在1990年代末,它还只是一个孤独的数学构想。李德毅带着这个构想参加了多次学术会议,遭遇的往往是困惑的眼神和礼貌的疏远。有一次,在一个全国性的智能系统研讨会上,一位资深教授在听完李德毅的报告后直言不讳:"李教授,您的云模型很有意思,但它能解决什么实际问题?如果它不能提高识别率、不能加快计算速度,那它不就是数学游戏吗?"
李德毅平静地回答:"教授,请问您如何向一台机器解释'差不多'这个词?在工程控制中,在医疗诊断中,在社会治理中,我们每天都在和'差不多'打交道。没有这种能力,机器永远只能处理实验室里干净的数据,走不出恒温恒湿的机房。"
那位教授沉默了。会场里响起了稀稀拉拉的掌声。但李德毅知道,真正的认可不会来自掌声,而来自时间。他需要的不是说服所有人,而是找到那个让云模型生根发芽的应用场景。
这个场景,最终在城市的道路上出现了。
四、从沙盘到方向盘
2000年以后,李德毅的学术重心开始发生一次深刻的转向。指挥自动化系统——那个他倾注了二十年心血的领域——依然重要,但他越来越被另一个问题所吸引:如果机器能够在复杂的战场态势中辅助人类决策,那么它能否在更日常、更开放、更混乱的环境中自主决策?比如,在城市的车流中?
这个转向不是偶然的。它根植于李德毅对"认知"理解的深化。战场和交通,在表面上截然不同,但在认知结构上惊人地相似:都是开放的复杂巨系统,都充满了不确定性和动态变化,都需要在信息不完备的情况下做出实时决策。更重要的是,两者都涉及"人"——战场上的指挥官和司机,都不是纯粹的逻辑机器,而是带着经验、直觉、情绪、习惯的生命体。
2004年前后,李德毅开始带领团队研究智能驾驶。这不是当时中国学术界的热门方向。大多数人认为,无人驾驶是谷歌和斯坦福的事情,是硅谷的神话,中国的路况太复杂、行人太不守规矩、交通标识太不统一,搞无人驾驶无异于痴人说梦。
但李德毅看到了别人没看到的东西。他认为,中国的复杂路况恰恰是最好的"认知实验室"。如果一个系统能在北京西直门立交桥的五层螺旋中自主导航,能在上海南京路的行人海洋中安全穿行,能在重庆的山城坡道上判断刹车距离,那它获得的认知能力将是普适的、坚韧的、真正接近人类的。
"很多人把智能驾驶当作一个计算机视觉问题,"李德毅在一次项目启动会上对团队说,"他们认为,只要摄像头够清晰、算法够先进、算力够强大,车就能自己开。这是误区。开车不是'看'的问题,是'理解'的问题。你看到一个行人站在路边,你要理解他是准备过马路还是只是在等人;你看到前车刹车灯亮了,你要理解它是准备停车还是只是踩了一下离合器。这种理解,不是识别能解决的,是认知能解决的。"
这番话在今天听来已是常识,但在近二十年前,它几乎是先知般的洞见。李德毅带领团队从最基础的"驾驶认知"研究做起。他们不做炫酷的激光雷达阵列,不追求极致的传感器精度,而是花大量时间坐在出租车里,观察人类司机怎么开车;他们分析交通事故报告,不是为了改进某个传感器,而是为了理解"认知失误"是如何发生的;他们甚至研究了老司机的"口述史",记录那些无法写进交通法规的"潜规则"——比如在中国的小城市里,按喇叭的次数和方式传递着复杂的社交信息。
这种研究方式在当时的工程界显得格格不入。资助方希望看到硬件成果,同行希望看到论文发表,而李德毅的团队却在做"人类学调查"。有人私下议论:"李院士是不是老了?怎么不搞正经的控制论,去搞这些虚头巴脑的东西?"但李德毅不为所动。他深知,如果没有对"驾驶认知"的深刻理解,所有的传感器和算法都只是盲目的技术堆砌。
2008年,李德毅团队推出了第一代"驾驶脑"的雏形。这不是一台装在车上的计算机,而是一个试图模拟人类司机认知架构的系统。它分为多个层次:感知层负责从传感器中提取"有意义"的信息,而不是原始数据;认知层负责把这些信息组织成"驾驶态势图",一幅动态的、包含道路、车辆、行人、交通信号、甚至天气和光线在内的整体图景;决策层则在这幅图景上,基于经验和规则做出驾驶行为选择。
这个架构在当时是革命性的。主流的自动驾驶方案是"感知-规划-控制"的流水线:感知模块识别物体,规划模块计算路径,控制模块执行动作。三个模块之间是单向的信息传递,像是一条工业生产线。而李德毅的"驾驶脑"是循环的、交互的、认知驱动的。感知影响认知,认知修正感知;决策依赖认知,认知也在决策过程中被实时更新。
"流水线的隐喻来自工业时代,"李德毅解释道,"但认知不是流水线。认知是一个不断建构、不断修正、不断预测的过程。你开车时,眼睛看到的东西会修正你脑中的预期,你脑中的预期又会影响你下一步看哪里。这是一种循环因果,不是线性因果。"
这个思想后来成为认知物理学的核心支柱之一。但在当时,它首先面临的是工程上的巨大挑战。如何让机器"理解"路权?如何让机器"预期"他车的行为?如何让机器在不确定中做出"合理"而非"最优"的决策?每一个问题都指向同一个深渊:当前的人工智能范式,是否足以支撑真正的自主认知?
五、那场著名的辩论
2009年秋天,中国人工智能学会的年会在南京召开。这是国内人工智能领域最高规格的学术盛会之一,与会者涵盖了从资深院士到青年学者的各个层面。李德毅作为学会的重要成员,被安排在大会做一场主旨报告。他选择的题目是《从计算智能到认知智能——人工智能的范式转移》。
报告的前半部分波澜不惊。李德毅回顾了人工智能六十年的发展历程,从符号主义到连接主义,从专家系统到深度学习,梳理了每一次浪潮的成就与局限。但当他开始阐述"认知智能"的概念时,会场的气氛悄然发生了变化。
"我认为,当前以深度学习为代表的人工智能,本质上是计算智能的延续。它在模式识别、大数据处理上取得了巨大成功,但它没有解决'理解'的问题。一个能识别猫的系统,不理解什么是猫;一个能赢棋的系统,不理解什么是棋。我们需要一场范式转移,从'计算'转向'认知',从'算法'转向'物理'。"
会场里出现了窃窃私语。坐在前排的一位计算机视觉领域的权威教授举手要求发言。获得许可后,他站起来,语气平和但立场鲜明:"李院士,我尊重您在控制论领域的贡献,但您对当前人工智能的评价是否过于悲观?深度学习在ImageNet上的识别准确率已经超过人类,机器翻译的质量已经接近专业译者,自动驾驶的测试里程数以亿公里计。这些难道不是'理解'吗?如果您说的'认知'不能转化为可量化的指标,那它是不是一种不可证伪的神秘主义?"
这个问题像一颗投入湖心的石子,会场瞬间安静下来。所有人都知道,一场重量级的学术交锋即将展开。
李德毅没有回避。他走到讲台边缘,仿佛要缩短与提问者之间的距离:"教授,您提到的准确率、里程数、BLEU分数,这些都是图灵测试精神的延续——看表现,不看内在。但我要问您一个问题:如果您的识别系统在一个从未见过的场景中——比如,一只被涂成斑马条纹的马——做出了错误的分类,您能解释它为什么错吗?您能预测它在什么其他场景中还会错吗?"
那位教授微微皱眉:"这是对抗样本的问题,是已知的技术挑战,不代表范式失败。"
"不,"李德毅摇头,"这不仅仅是技术挑战。这说明系统没有形成'马'的概念,它只是找到了区分马和斑马的数据特征。当特征被扰动,分类就崩溃。而人类儿童,即使看到一只紫色的、长着翅膀的、卡通化的马,依然知道那是'马的一种变体'。因为人类有概念,有范畴,有对本质的把握。这种把握,不是来自数据的相关性,而是来自对物理世界因果结构的理解。"
他停顿了一下,环视全场:"我们搞人工智能,不能永远停留在'行为主义'的层面。行为主义说,别管黑箱里有什么,看输出就行。这在科学发展的某个阶段是有效的,但如果我们要建造真正可信的智能系统——比如自动驾驶汽车,比如医疗诊断系统——我们就必须打开黑箱,必须理解认知的物理机制。否则,我们就是在建造我们不懂的机器,然后让它们替我们做生死攸关的决策。"
会场里响起了掌声,也有嘘声。另一位从事自然语言处理的学者站起来质疑:"李院士,您说要从物理学的角度理解认知,但物理学研究的是物质和能量,认知研究的是信息和意义。这是两个层面。您如何把它们统一起来?"
李德毅的眼睛亮了起来。这正是他等待的问题。
"问得好,"他说,"这正是我接下来要说的。物理学从来不止研究基本粒子。热力学研究能量的转化,统计物理研究大量粒子的集体行为,相对论研究时空的结构。这些分支都不直接处理'物质本身',但它们都是物理学。为什么?因为它们追求的是第一性原理,是现象背后不可还原的规律。我认为,认知也是一种物理现象。它不是漂浮在物质之上的幽灵,而是物质、能量、结构和时间在特定组织形态上的涌现。认知物理学,就是要找到认知的第一性原理。"
这场辩论持续了将近四十分钟,远超会议预定的时间。主持人不得不介入,提议将讨论延续到晚间。那天晚上,在酒店的大堂吧里,争论依然在继续。年轻的学者们分成两派,一派认为李德毅在人工智能的盛世危言中看到了真问题,另一派认为他只是在用模糊的哲学语言包装工程上的无力。
李德毅没有参加晚间的大堂吧论战。他独自走在南京的梧桐树下,秋夜的凉风吹散了会议室里的燥热。他知道,这场辩论不会有一个即时的胜负。思想的转变需要一代人的时间。但他也确信,自己触碰到了某种真实的东西——那个让空塑料袋在五环路上飘舞、让老司机预判前车动向、让乌鸦弯折铁丝的深层机制。这个机制,不在算法的精妙里,而在物理的质朴中。
六、物理学乡愁
"认知物理学"这个名称,在李德毅的心中酝酿了很久。正式提出是在2010年代初期,但思想的种子可以追溯到更早。
为什么是"物理"?在公众的理解中,物理学是研究天体运行、粒子碰撞、能量转化的学问,与"认知"这个心理学和哲学的领地似乎风马牛不相及。但李德毅对"物理学"有着更本质的理解。在他看来,物理学是人类文明中最接近"第一性原理"的学科。它不问"怎么做",而问"是什么";它不满足于描述现象,而追求揭示规律;它相信宇宙是有秩序的,这种秩序可以用简洁的数学语言来表达。
"人工智能研究需要这种'物理学精神',"李德毅后来解释,"过去几十年,人工智能更像是一门技术,而不是科学。技术关心的是'如何做出更好的产品',科学关心的是'这些产品背后的原理是什么'。当AlphaGo赢了棋,技术界欢呼雀跃,但科学界应该问:它为什么能赢?它赢的方式和人类赢的方式一样吗?这种'赢'的能力,遵循什么样的普遍规律?"
这种追问,李德毅称之为"物理学乡愁"。它不是要回到牛顿或爱因斯坦的具体理论,而是要回到物理学那种追求统一、追求根基、追求简洁的精神气质。在人工智能领域浸淫越久,他越感到一种失根的痛苦:无数的算法像野草一样疯长,每一个会议都涌现出新的网络结构、新的优化策略、新的训练技巧,但这些东西之间缺乏统一的联系,像是一座没有地基的摩天楼。
"我有时候看人工智能的论文,感觉像在看中世纪的炼金术,"李德毅曾半开玩笑地说,"每个人都在调配自己的秘方,加一层网络、换一种激活函数、调一下学习率,然后祈祷效果变好。偶尔有人炼出了黄金,大家就一拥而上模仿他的坩埚。但为什么这剂配方能炼出黄金?不知道。这不符合现代科学的精神。现代科学的精神是,你要能从第一性原理出发,推导出为什么这样做是有效的。"
认知物理学的提出,正是为了建立这样的"第一性原理"。李德毅认为,认知不是神秘的心灵现象,而是可以像热力学或电磁学一样被系统研究的物理过程。它的研究对象不是神经元或晶体管这些具体的"硬件",而是认知活动本身所遵循的组织规律——就像热力学研究的不是单个分子的运动,而是大量分子集体的温度、压力和熵。
这种视角的转换是革命性的。它意味着,我们不必等到完全破解大脑的神经机制才能理解认知,就像十九世纪的物理学家不必等到发现原子结构就能建立热力学定律。认知作为一种"宏观现象",有其独立于微观实现方式的规律。这些规律可能涉及信息的组织、能量的消耗、结构的维持、时间的演化——正是"物质、能量、结构、时间"这四要素。
"四要素说"的提出,是认知物理学从哲学构想走向科学框架的关键一步。李德毅借鉴物理学的方法论,将复杂的认知现象还原为这四个基本维度的交互。物质提供载体,能量提供动力,结构提供组织形式,时间提供演化方向。认知不是其中任何一个要素的单独产物,而是四者耦合的涌现属性。
这个框架的提出,在学术界引起了复杂的反应。一些物理学家感到被冒犯:一个搞控制的工程师,凭什么来"瓜分"物理学的领地?一些认知科学家则感到困惑:四要素说似乎过于宏大,如何转化为可操作的实验?但也有一些跨学科的学者感到兴奋:终于有人试图在人工智能的喧嚣中,建立起一种统一的、根基性的理论语言。
李德毅对此保持着他一贯的平静。他知道,任何原创性的理论在诞生之初都是粗糙的、不完整的、甚至是有漏洞的。但这不妨碍它的方向正确。牛顿的第一版《原理》也有很多错误,但它确立了经典力学的范式。认知物理学的使命,不是一次性解决所有问题,而是为人工智能研究提供一个新的坐标系——一个从物理学第一性原理出发的坐标系。
七、驾驶脑与认知的试金石
理论的成熟需要实践的磨砺。认知物理学的真正成型,离不开李德毅团队在智能驾驶领域长达十余年的深耕。
2015年,一个具有历史意义的时刻到来了。李德毅团队研发的无人驾驶大客车,完成了从郑州到开封的公开道路测试。这是全球首例无人驾驶大客车在正式开放道路上的长距离行驶。三十三公里的路程,包含了城市道路、高速公路、收费站、隧道等多种复杂场景。车辆没有人类司机干预,完全依靠"驾驶脑"自主决策。
当车辆平稳地停在开封的目的地时,团队里的年轻工程师们欢呼雀跃。但李德毅的表情却若有所思。他在事后的总结会上说:"这次测试成功了,但它也暴露了我们的软肋。在绝大多数路段,机器开得比人还稳,但在几个特殊场景下,它的表现暴露了'不理解'的本质。"
他指的是一个具体场景:在一段施工路段,路面被锥形桶引导成S形弯道,同时有工人在路边作业。人类司机远远看到这一幕,会立刻理解"施工""改道""注意行人"这一整套情境,并自然地减速、观察、选择车道。但当时的"驾驶脑"把锥形桶识别为"障碍物",把工人识别为"行人",然后分别对这两个"目标"做出反应——减速避让障碍物,注意行人安全——却没有把它们组织成一个整体的"施工场景"来理解。
"它看到了零件,没有看到整体;它识别了物体,没有理解情境,"李德毅说,"这就是当前人工智能的瓶颈。我们给了它无数的数据去训练,但它学会的是'看到锥形桶要减速',而不是'锥形桶意味着施工,施工意味着道路环境改变,道路环境改变意味着驾驶策略需要整体调整'。这种层次化的、情境化的理解,正是认知物理学要解决的。"
这个场景后来成为李德毅反复使用的教学案例。他用它来说明"思维软构体"与"物质硬构体"的关系。传感器和芯片是硬构体,它们提供了认知的物理基础;但"施工场景"这个概念,以及这个概念所携带的一整套驾驶策略调整,是软构体——它是非物质的、可迁移的、可以在不同车辆之间共享的认知结构。人类老司机之所以能在新城市快速适应,不是因为他的眼睛换了新的硬件,而是因为他脑中携带着大量可迁移的软构体。
从2015年到2020年,李德毅团队持续迭代"驾驶脑"。他们不再满足于让车"识别"更多物体,而是致力于让车"理解"更多情境。他们引入了"路权"的概念——这不是交通规则里简单的"红灯停绿灯行",而是一种动态的、协商的、充满社会性的认知框架。在十字路口,路权不仅由信号灯决定,还由车速、车型、甚至眼神和手势决定。要让机器理解这种复杂的社会契约,必须赋予它一种更高层次的认知能力。
"路权是驾驶认知的'语法',"李德毅解释道,"就像语言的语法一样,它不是词汇的堆砌,而是词汇的组织规则。一个掌握了路权的机器,即使遇到从未见过的具体场景,也能根据'语法'做出合理推断。这是从'记忆'到'理解'的飞跃,也是从'计算智能'到'认知智能'的飞跃。"
这些工程实践,像一块块粗糙的矿石,被认知物理学的理论熔炉不断冶炼。云模型被用来处理驾驶概念的不确定性——"拥堵""危险""安全距离"这些词,在不同情境下有不同的云状边界;数据场和拓扑势被用来从海量交通数据中提取认知结构;认知螺旋理论被用来解释驾驶技能的自成长——一个新手司机如何通过对经验的抽象、联想和交互,逐渐成长为老司机。
理论与实践的双螺旋上升,让认知物理学从一个抽象的哲学构想,逐渐成长为具有可操作性的科学框架。它开始有了自己的核心概念、形式化工具、应用场景和验证方法。虽然它还远未成熟,但它已经证明了自身的生命力:它不仅能解释认知,还能指导工程。
八、回归物理
2018年冬天,清华大学的一间会议室里,李德毅面对一群来自物理学、神经科学、计算机科学和哲学的学者,做了一场题为《认知物理学的缘起与展望》的报告。这是他第一次向如此跨学科的听众系统阐述认知物理学的全貌。
报告结束后,一位理论物理学家提问:"李院士,您说认知物理学要用物理学的第一性原理研究认知。但物理学有一个传统,就是追求数学上的严格性。您的四要素说、软构体、认知螺旋,这些概念目前似乎还停留在定性描述阶段。您如何保证认知物理学不会沦为一种'物理隐喻',而不是真正的物理科学?"
这个问题很尖锐,也很公平。李德毅沉思片刻,回答说:"您说得对,认知物理学目前确实还处于'前严格'阶段。但请回想一下,当开尔文勋爵提出热力学第二定律时,'熵'的概念在微观层面也是模糊的;当麦克斯韦提出电磁场理论时,'场'的存在也是充满争议的。一门新科学在诞生之初,往往先要有概念的突破,然后才有数学的严格化。我现在可以告诉您,认知物理学的数学化是我们团队正在努力的方向,但我不想等数学完全准备好了再提出这个框架。因为人工智能的发展已经等不及了,我们需要一个范式的指引,哪怕它现在还是粗糙的。"
他接着说:"更重要的是,我认为物理学不仅仅是公式和实验。物理学是一种精神:相信世界是可理解的,相信复杂现象背后有简单规律,相信不同层次的现象可以被统一描述。认知物理学首先要继承的,正是这种精神。我们要相信,认知不是魔法,而是自然的一部分;它不是 exempt from physical law,而是 physical law 的一种高级表现。"
这番话赢得了那位物理学家的点头。会场里,不同学科的学者们开始意识到,他们面对的不仅仅是一个新的技术框架,而是一种新的科学可能性——一种将人类最古老的心灵之谜,与人类最可靠的科学传统连接起来的尝试。
从爱丁堡的雾到北京的五环,从雷达波到方向盘,从模糊数学的云端到认知物理学的四要素,李德毅的学术人生呈现出一条清晰的弧线:不断向下挖掘,不断向根基回溯。他从未满足于在某个学科的表层做修补,而是始终追求那种能够贯通多个领域的底层原理。
这种追求,在某种意义上是一种"乡愁"——对物理学黄金时代的乡愁,对那种用一个方程解释万千现象的乡愁,对科学统一性的乡愁。但这不是怀旧的乡愁,而是建设的乡愁。李德毅不是要回到过去,而是要在新的疆域——认知的疆域——重建那种物理学的统一性。
今天,当人工智能的浪潮再次席卷世界,当大模型以惊人的规模吞噬着人类的文本和知识,认知物理学的提出显得愈发迫切。它提醒我们,在追求更大模型、更多数据、更强算力的狂奔中,不要忘记那个最根本的问题:认知究竟是什么?它如何在物理世界中诞生?它遵循什么样的不可违背的规律?
这些问题,不会由更快的芯片回答,不会由更深的网络回答,而只能由一种全新的科学视角回答——一种把认知视为物理现象、把智能视为自然演化、把意识视为结构涌现的视角。
李德毅院士已经在这条路上走了很远,但他知道,真正的旅程才刚刚开始。认知物理学的框架已经搭起,但它的细节需要一代又一代研究者的填充;它的预言需要实验的验证;它的哲学需要科学的淬炼。
在下一章,我们将走进这个框架的核心,去触摸那四把钥匙——物质、能量、结构、时间。我们将看到,它们如何像四位古老的守护者,共同开启了认知的奥秘之门。而那只五环路上的空塑料袋,那位出租车司机的预判,那只在爱丁堡雾中缓缓移动的货轮,都将在四要素的光芒中,显现出它们深藏已久的统一性。
风还在吹,雾还会起。但物理学家的灯,已经亮了。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-30 07:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社