别人成仙得道,我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

李德毅院士的认知物理学 第八章 方向盘后:智能驾驶中的认知物理学实践

已有 593 次阅读 2026-5-27 07:46 |个人分类:我思故我在|系统分类:观点评述

第八章 方向盘后:智能驾驶中的认知物理学实践    

    一、西直门桥上的"死机"

    清晨六点四十五分,北京西直门立交桥。这座被司机们称为"世界第九大奇迹"的五层互通式立交,像一座巨大的钢铁迷宫悬浮在城市上空。来自二环路、西直门内大街、西直门外大街、北展桥和德胜门方向的车辆,在这里交汇、分流、盘旋,形成一股复杂到令人眩晕的金属湍流。

    一辆搭载当时最先进自动驾驶系统的黑色轿车,正从西直门内大街的匝道驶入主桥。它的车顶旋转着激光雷达,翼子板里藏着毫米波雷达,挡风玻璃后是三目摄像头阵列。车载计算机的算力相当于数千台早期个人电脑的总和,它的高精度地图精确到厘米级,存储了这座立交桥每一个坡度的倾角、每一条标线的坐标。

    然而,在驶入第五层盘旋弯道的那一刻,系统开始"犹豫"了。

    前方,一辆蓝色厢式货车正在右侧车道缓慢行驶,车尾部贴着"保持车距"的反光条,但显然没有保持车距。左侧,一辆银色奥迪突然从并行匝道切入,没有打转向灯,以一种只有北京老司机才掌握的"斜插"姿态挤进了车队。更远处,桥面的导流标线因为常年磨损已经斑驳不清,在晨光的斜射下像一条褪色的灰色丝带。

    自动驾驶系统的传感器忠实地捕捉到了这一切:激光雷达点云显示货车的三维轮廓,摄像头识别出奥迪的车牌和车型,高精地图提示此处应为"单向双车道"。但系统的决策模块陷入了困境。按照"感知-规划-控制"的流水线逻辑,它需要先"识别"所有目标,再"预测"它们的轨迹,然后"规划"自己的路径,最后"执行"转向和加减速。但眼前的场景太混乱了:奥迪的切入意图不明,货车的速度忽快忽慢,标线不清导致车道边界模糊。规划算法在几种可能的方案之间振荡:减速跟随?变道超车?保持当前车道?

    这种振荡直接体现在车辆的行动上。它先是猛地减速,让后车司机惊出一身冷汗;然后试探性地向左偏移,发现奥迪并没有让出空间,又急刹回正;最后以一种僵硬得近乎机械的姿态,紧紧跟在货车后面,车速降到了每小时二十公里,在早高峰的车流中形成一个小小的拥堵漩涡。

    后座上的人类安全员握紧了扶手。他是一位有十五年驾龄的老司机,此刻恨不得夺过方向盘。他知道问题出在哪里:机器在"看",但它没有"理解"。它看到了货车、奥迪、标线,但它没有理解这是一个中国式的路权博弈现场——奥迪的斜插是一种"试探性宣告":我要进来了,你看着办;货车的慢速是一种"被动占有":我就占着这道,你超不过去;标线的模糊是一种"默认契约":大家都靠右一点,形成一条没有明文规定但心照不宣的车道。这些理解不需要精确计算,而需要一种社会性的直觉

    安全员后来在接受采访时说了一段被广泛引用的话:"那三分钟里,机器像一个刚拿到驾照的外国留学生,紧张、刻板、不懂潜规则。而人类司机呢?我们在这座桥上开了十年,闭着眼睛都能'感觉'到哪个缝隙能钻,哪个眼神能让,哪个时机必须果断。这种'感觉'不是数据能教会的。"

    这个场景像一面棱镜,折射出传统自动驾驶范式的根本困境。

    二、流水线的黄昏

    过去二十年,自动驾驶领域的主流技术路线,可以概括为一条工业流水线:感知、规划、控制。这条流水线继承自机器人学的经典框架,也暗合了图灵机"输入-处理-输出"的计算隐喻。

    在感知层,机器用摄像头看颜色,用激光雷达测距离,用毫米波雷达测速度,用高精地图定位。这些传感器像一群尽职的哨兵,把物理世界转化为数字世界的点云、像素和坐标。在规划层,算法根据感知结果,在虚拟空间中搜索一条最优路径:避开障碍物,遵守交规,最小化能耗,最大化舒适度。在控制层,执行器把规划结果转化为物理动作:方向盘转多少度,油门踩多深,刹车加多大的力。

    这条流水线在封闭场景中表现出色。高速公路上的自适应巡航、停车场里的自动泊车、封闭园区里的无人配送,都是流水线的胜利。因为这些场景是结构化的:车道线清晰,交通规则明确,参与者行为可预测。流水线擅长处理确定性

    但城市开放道路是反结构化的。西直门立交桥上的那个早晨,就是反结构化的典型现场。标线磨损了,交通规则让位于"潜规则",其他车辆的行为充满了意图性社会性。流水线的崩溃,不是某个模块的技术失败,而是整个范式的不匹配

    李德毅院士早在2000年代初期,就敏锐地察觉到了这种不匹配。当时,大多数研究者把自动驾驶当作一个计算机视觉问题控制工程问题来攻克:只要看得够清楚,算得够快,控制得够准,车就能自己开。但李德毅提出了一个反直觉的观点:自动驾驶的本质不是感知问题,不是规划问题,甚至不是控制问题。它的本质是认知问题。

    "你问一个老司机,他怎么开车,"李德毅在一次学术报告中说道,"他很少会说'我先看左边摄像头,再算轨迹方程'。他会说'我看那辆车想变道','前面那个人可能要闯红灯','这个路口得让着公交车'。这些话里充满了意图预期社会规范。驾驶不是一个人在路上的独奏,而是几十个人在路上的合奏。不理解这种合奏的语法,永远造不出真正的自动驾驶。"

    这种洞见,直接催生了李德毅团队的核心技术路线:驾驶脑

    三、驾驶脑:从流水线到闭环

    "驾驶脑"不是一台更强大的车载计算机,而是一种全新的认知架构。李德毅借鉴人类驾驶员的认知方式,把驾驶系统从"感知-规划-控制"的线性流水线,重构为"认知-决策-执行"的动态闭环

    这个架构的核心是驾驶态势认知图。它不是传感器原始数据的堆砌,而是一幅被理解了的、结构化的、有情境意义的交通图景。在这幅图景里,车道线不仅是像素坐标,而是"可行驶区域"的边界;其他车辆不仅是运动障碍物,而是"具有意图的参与者";红绿灯不仅是颜色状态,而是"路权分配的指令";行人不仅是检测框,而是"可能改变道路生态的变量"。

    认知层的构建,需要一种超越模式识别的理解能力。传统系统的摄像头"看到"一辆公交车停在站台边,识别结果可能是"大型车辆,静止状态"。但驾驶脑的认知层会进一步理解:"公交车在上下客,它的路权状态正在从'行驶'转变为'临时占有',它随时可能起步并入车道,周围的社会车辆应该形成让行默契。"这种理解,李德毅称之为"路权"的感知

    路权,是驾驶脑理论中最具原创性的概念,也是最难被传统工程思维消化的概念。在交通工程教科书里,路权是由信号灯、标志标线、交通法规明确分配的:绿灯你有路权,红灯你没有;直行你有优先权,转弯你必须让行。这些规则是显性的、二元的、可编码的

    但李德毅指出,真实世界中的路权,百分之八十是隐性的、模糊的、协商性的。在一个没有信号灯的小巷口,两辆车相遇,谁该先走?这取决于谁先到达路口、谁的速度更快、谁的眼神更坚定、甚至谁的车型更大。在拥堵的环路上,一辆车打转向灯请求变道,后车是让还是不让?这取决于后车司机的心情、两车的相对速度、甚至当时的交通广播内容。公交车从站台起步,社会车辆是否减速让行?在很多城市,这取决于一种不成文的"公交优先"社会默契,而不是某条具体的法律条文。

    路权因此不是静态的规则,而是动态的社会契约。它在每一秒钟都被所有道路参与者重新协商、确认或打破。人类司机之所以能在复杂的交通中流畅行驶,不是因为他们背诵了所有的交通法规,而是因为他们内化了这种路权协商的语法。他们知道什么时候该"强硬",什么时候该"退让",什么时候该"假装没看见",什么时候该"用灯光打个招呼"。

   驾驶脑的目标,就是让机器也能理解这种语法。这不是通过增加更多的传感器或更强大的算力就能实现的,而是需要一种认知范式的跃迁:从"识别物体"到"理解情境",从"遵守规则"到"协商路权",从"执行程序"到"参与社会"。

    四、郑开大道:一场跨越十年的长征

    2015年8月29日,凌晨四点三十分,郑州柳林收费站。天还没亮,空气中带着中原地区夏末特有的潮湿闷热。一支由三辆大型客车组成的车队正在做最后的出发准备。这些车看起来与普通长途客车无异,白色车身,蓝色腰线,车窗贴着深色的防晒膜。但仔细看,车头上方多了一个微微隆起的"额头"——里面藏着激光雷达和摄像头;车身侧面多了几个不起眼的黑色小孔——那是毫米波雷达的窗口;驾驶座上的"司机"双手虚搭在方向盘上,目光平静地注视着前方。

    这是李德毅团队研发的无人驾驶大客车。今天,它们要完成一项前所未有的挑战:从郑州出发,沿郑开大道行驶约三十三公里,抵达开封。这不是在封闭的测试场,也不是在夜深人静的空旷道路,而是在正式对社会车辆开放的城市道路上,在真实的交通流中,完成全程无人驾驶。

    团队成员分散在三辆车的乘客区,每人面前都摆着笔记本电脑,屏幕上跳动着车辆的各项参数。但按照设计,在整个行驶过程中,人类不会干预车辆的决策。驾驶脑将完全自主地处理一切:红绿灯、交叉路口、行人、社会车辆、收费站、甚至突发状况。

    李德毅站在收费站的路边,穿着一件浅蓝色的衬衫,被早起的蚊虫围绕着。他看了看表,又看了看天。东方已经泛起鱼肚白,郑开大道的轮廓在晨曦中逐渐清晰。这条道路连接着两座千年古城,今天,它将成为中国智能驾驶史上的一条里程碑。

    五点整,车队出发。

    第一辆车平稳地驶过收费站ETC车道。驾驶脑准确地识别了车道边界和栏杆状态,在恰到好处的时机减速、等待、加速。收费站的工作人员探出头,目瞪口呆地看着这辆没有司机操作却精准通过的车辆。

    随后的路程,像一场精心编排但又充满即兴的交响乐。郑开大道在当时是一条双向十车道的宽阔道路,中间有绿化带隔离,路况相对良好。但"相对良好"并不意味着简单。车队需要应对:

    信号灯:路口的红绿灯状态被摄像头捕捉,驾驶脑不仅要识别颜色,还要计算倒计时,预测绿灯剩余时间是否足够通过,从而决定是匀速通过还是提前减速。

    社会车辆:早起的货车、出租车、私家车在车流中穿梭。驾驶脑需要持续跟踪数十个动态目标,预测它们的轨迹,理解它们的意图。

    行人:虽然主干道上有隔离栏,但偶尔会有行人横穿辅路,或者站在路边等待过马路。驾驶脑需要判断他们是"准备通过"还是"只是看看"。

    施工路段:道路养护是常态,锥形桶、警示牌、临时改道标线对机器来说是严峻的考验——它们不在高精地图中,却是必须理解的临时路权状态。

    收费站与隧道:光线突变、空间狭窄、定位信号减弱,这些都是对感知和认知的极限测试。

    车队行驶到中途时,出现了一个惊险的瞬间。一辆社会车辆突然从右侧辅路加速切入主路,距离第一辆大客车仅有不到三十米。按照传统自动驾驶的流水线逻辑,系统可能会因为"距离过近、目标突然出现"而触发紧急制动,导致车内乘客剧烈前倾,甚至引发后车追尾。但驾驶脑的认知层做出了不同的判断:它通过分析该车的加速度、切入角度、以及前方车流的空隙,判断这是一辆"强行加塞"的车辆,其意图是占据前方空位而非恶意别车。驾驶脑没有急刹,而是适度减速,同时向左微调方向,为社会车辆让出一个刚好足够的空间——就像一个经验丰富的老司机那样,既避免了碰撞,又保持了行驶的流畅性。

    车内监控记录下了乘客区的反应。一位团队成员下意识地抓住了扶手,但随即松开了,笑着说:"它比我处理得还稳。"

    六点十五分,车队平稳驶入开封市的预定终点。三十三公里,历时七十五分钟,全程无人工干预,无交通事故,无违规行驶。当车门打开,李德毅走下车时,朝阳正好跃出地平线,把车身染成金色。团队成员们互相拥抱,有人眼眶湿润。这一刻,他们不仅完成了一次技术测试,更完成了一次认知哲学的验证:机器可以在开放道路上,像人类一样理解路权、协商空间、参与社会。

    这是中国智能驾驶史上的标志性事件,也是全球范围内首次无人驾驶大客车在正式开放道路上的长距离测试。但它的意义远不止工程层面。它证明了,当机器拥有了"驾驶脑",拥有了路权认知能力,它就不再是一个按照程序僵硬执行的机器人,而是一个能够理解社会情境的认知主体

    五、路权:道路上的"语法"

    郑开大道测试的成功,让"路权"这个概念从学术讨论走向了工程实践。但要真正理解路权的深度,我们需要把它从高速公路的宏大叙事,拉回到日常街道的琐碎细节中。

    想象一下这个场景:下午五点,某城市老城区的一条双向两车道小路。路两侧停满了私家车,中间只留下刚好够一辆车通过的宽度。一位母亲骑着电动车,后座载着刚放学的孩子,从对面驶来。同时,你驾驶的车辆正行驶在这一侧。按照交通规则,狭窄路段相遇,应该遵循"先进入者优先"或"靠右让行"的原则。但真实的情况往往更复杂:

    如果母亲车速很快,表情焦急,她可能是在赶时间接另一个孩子,她的路权预期是"我不会让"; 如果你看到她孩子书包上别着的"三好学生"徽章,你可能会出于某种社会情感而主动停车; 如果你们同时到达狭窄段,目光相遇,一个微笑或一个手势,就完成了路权的瞬时协商; 如果此时路边突然窜出一只猫,母亲急刹,她的路权状态瞬间改变,你需要重新评估整个情境。

    这些情境无法被编码为"如果A则B"的规则。它们是社会性的、情感性的、即兴的。李德毅指出,人类司机处理这些情境时,依赖的不是交通法规的条文,而是一种内化的"道路伦理":对弱者的保护(电动车上的母子)、对效率的尊重(谁的时间更紧迫)、对风险的共情(谁更容易在避让中受伤)、甚至对尊严的维护(不让对方感到被欺负)。

    驾驶脑的设计,正是试图捕捉这种道路伦理的统计规律动态结构。它不是要让机器拥有人类的情感,而是要让机器能够理解情感在路权协商中的作用。比如,当系统检测到前方是一位行动迟缓的老人时,它的路权评估会倾向于"主动让行",不是因为"尊老爱幼"的道德律令被写入了代码,而是因为这种让行策略在长期统计中呈现出更高的社会接受度整体通行效率

    路权还有一个更微妙的维度:时间性。人类司机在驾驶时,不仅感知当下的路权状态,还持续地预期未来的路权变化。看到前方公交车打左转向灯,老司机不会等到它开始变道才反应,而是提前减速,预留空间——因为他"预期"到了公交车即将产生的路权请求。看到路边一个行人回头张望,老司机可能会松开油门,因为他"预期"这个人可能要转身横穿。这种预测性的路权感知,是流畅驾驶的关键。

    传统自动驾驶系统也有"预测"模块,但那是基于运动学的外推:根据目标当前的速度和加速度,计算它三秒后的位置。而驾驶脑的预测是基于意图的:它试图理解目标"想做什么",而不仅仅是"在做什么"。这种理解当然是不确定的,是概率性的,是云状的——它用云模型来处理"意图"的不确定性:期望(最可能的意图)、熵(意图的模糊范围)、超熵(不同情境下的漂移)。

    六、四要素在方向盘后的舞蹈

    如果我们用认知物理学的四要素透镜来审视智能驾驶,一幅完整的图景就会浮现。

    物质(硬构体)是车辆的物理存在。车身、底盘、发动机、传感器、计算平台、通信模块。这些物质基础决定了认知的可能性边界。一辆配备顶级激光雷达和算力芯片的车辆,与一辆只装摄像头的车辆,拥有不同的认知"肉身"。李德毅团队选择大客车作为测试平台,本身就具有深意:大客车体积庞大、惯性大、制动距离长,它的硬构体特性决定了它的认知策略必须更加审慎、提前、社会化。它不能像小轿车那样灵活穿插,而必须更多地依赖路权协商而非机动规避

    能量是驾驶系统的动力源泉,也是其代谢成本。传统燃油车的能量来自汽油的燃烧,电动车的能量来自电池的放电。但驾驶脑的能量消耗不仅包括驱动车辆行驶的机械能,还包括支撑认知活动的电能。传感器的数据采集、认知层的态势图构建、决策层的多方案评估、通信模块的车路协同,都在持续消耗能量。李德毅指出,未来的智能驾驶必须在能量效率上实现突破:认知不能是无节制的"暴力计算",而必须是有选择的、情境自适应的、节能的。就像人脑在驾驶时会"屏蔽"无关信息(你不会注意到路边每一棵树的细节),驾驶脑也需要学会注意力分配,把宝贵的能量集中在与安全和效率最相关的认知任务上。

    结构(软构体)是驾驶脑的核心。驾驶态势认知图、路权评估模型、决策树、控制策略,这些都是运行在车辆硬构体上的思维软构体。它们可以被迁移、更新、共享。一辆车的驾驶经验,理论上可以通过数据上传,转化为另一辆车的认知结构。这种软构体的可迁移性,是智能驾驶规模化的关键。但李德毅警告,软构体的迁移必须考虑硬构体的兼容性。为大客车优化的路权策略,不能直接迁移到小轿车,因为二者的物理特性(尺寸、动力、制动能力)不同,导致它们在路权协商中的"话语权"不同。

    时间是驾驶认知中最残酷的维度。人类司机在紧急情况下,反应时间约为零点七秒到一点五秒。驾驶脑的反应时间可以更快,但这不意味着它更安全。因为驾驶中的时间不是反应时间,而是预期时间。优秀的司机在危险发生前三秒就已经开始了规避准备,而糟糕的司机即使在危险发生的瞬间做出反应,也可能为时已晚。驾驶脑的设计强调时间的延展性:不是缩短反应时间,而是延长预期时间——通过更好的情境理解,更早地识别潜在风险,把"紧急反应"转化为"从容调整"。

    四要素在驾驶场景中不是孤立运作的,而是耦合纠缠的。车辆的硬构体特性(大客车)决定了它的能量策略(不能频繁急加急减),能量策略影响了它的驾驶风格(平稳、预判),驾驶风格塑造了它的路权软构体(倾向于协商而非竞争),而路权软构体又在时间维度上展开为一系列预期和决策。这种耦合,使得每一辆智能驾驶车,如果真正拥有驾驶脑,都会发展出自己独特的"驾驶个性"——不是工程师刻意设计的,而是四要素在长期运行中自组织涌现的。

    七、具身的缺席与回归

    郑开大道测试之后,李德毅团队没有停止,而是继续向更深的难题进军。其中一个核心追问是:驾驶是否必须依赖具身认知?

    传统自动驾驶的答案是"否"。它认为,只要传感器足够多、算法足够强,机器不需要"身体"也能开车。摄像头是眼睛,雷达是耳朵,GPS是方向感,计算机是大脑。身体只是承载这些设备的平台,本身不参与认知。

    但认知物理学给出了不同的答案。李德毅认为,驾驶是一种深刻的具身活动。人类司机之所以能成为老司机,不仅因为他"看"得多,更因为他"感受"得多:方向盘的力反馈告诉他前轮是否打滑;座椅的震动告诉他路面是否平整;车身的侧倾告诉他弯道的离心力;甚至引擎的声音变化,也在潜意识中告诉他动力储备的状态。这些感受不是"额外信息",而是认知的构成性要素。它们让司机与车辆融为一体,形成了一种"我即车"的身体图式

    驾驶脑的设计因此强调具身交互。它不是让机器被动地"接收"传感器数据,而是让机器主动地"感受"车辆状态。方向盘不是简单的执行器,而是力反馈的通道;底盘不是被动的承载结构,而是路面信息的传导器;动力系统不是抽象的能量输出,而是加速质感的来源。当驾驶脑做出一个转向决策时,它不仅计算"转十五度",还预期"这种转向力度下,车身会如何响应,乘客会如何感受,轮胎是否会尖叫"。这种预期,使驾驶行为从"机械执行"升华为"身体表达"

    一个有趣的对比实验可以说明问题。李德毅团队曾让同一套驾驶脑软件,分别运行在两种硬构体上:一种是配备高端电控转向和主动悬架的测试车,另一种是转向和悬架相对简陋的改装车。在相同的测试场景中,前者的驾驶表现明显更流畅、更自信、更像人类老司机;后者则显得犹豫、生硬、过度保守。软件相同,但硬构体的"身体感"不同,导致了认知行为的差异。这直接验证了认知物理学的核心命题:软硬构体相互纠缠,共同塑造认知。

    这个发现对智能驾驶产业有深远的影响。它意味着,未来的自动驾驶不能只是"软件定义汽车",而必须是"软硬协同定义驾驶"。车辆的物理特性——转向精度、悬架调校、动力响应、甚至座椅的包裹感——都将参与驾驶认知的构建。一辆"好开"的智能驾驶车,不仅要有聪明的算法,还要有能够与算法对话的身体

    八、恶劣天气:当世界褪去标签

    如果说郑开大道的测试证明了驾驶脑在良好条件下的能力,那么真正的考验来自恶劣天气。因为认知物理学认为,认知的可靠性不在于顺境中的表现,而在于逆境中的鲁棒性

    2016年深秋,李德毅团队在山东某测试场进行了一场特殊的实验。他们选择了一个雨雾交加的傍晚,能见度不足五十米,路面有积水,标线被雨水覆盖得若隐若现。这种天气对人类司机都是严峻的考验,对机器更是地狱模式。

    传统自动驾驶系统在这种环境下的表现极具代表性:摄像头的视野被雨幕切割成模糊的色块,车道线检测算法频繁失效;激光雷达的激光束在雨雾中发生散射,产生大量虚假障碍物点云;高精地图的"车道级"精度在物理世界褪色后失去了参照意义。系统不断发出"感知降级"的警告,最终被迫退出自动驾驶模式,要求人类接管。

    驾驶脑面临同样的传感器困境,但它的应对方式截然不同。当车道线无法被可靠识别时,它没有"死机",而是启动了路权认知的降级策略:既然无法精确知道"我在哪条车道",那就从社会行为中推断路权。它观察前车的尾灯轨迹,推断出前车司机选择的行驶路径;它分析对向车流的灯光分布,推断出道路的中心线大致位置;它甚至利用路边护栏的反光轮廓,构建出一条"临时车道"的认知。这不是精确的几何定位,而是基于情境理解的模糊导航

    更关键的是,驾驶脑在恶劣天气下表现出一种类似人类老司机的保守智慧。它主动拉大跟车距离,降低变道频率,在路口提前减速,用灯光和喇叭与其他车辆建立更明确的沟通。它似乎"知道":在这种天气里,路权协商的容错率降低了,任何激进的举动都可能引发连锁风险。这种"知道"不是来自某条"雨天减速百分之二十"的规则,而是来自路权云模型在情境参数改变后的自适应漂移:期望(安全距离的中心值)向更大的数值移动,熵(不确定性范围)扩大,超熵(情境敏感度)升高。

    李德毅在测试后的总结会上说了一段意味深长的话:"恶劣天气是认知的试金石。它剥离了那些依赖理想条件的'伪智能',暴露出系统是否真正理解驾驶的物理本质和社会本质。一个真正理解驾驶的系统,在看不见标线的时候,应该像盲人一样,用听觉和触觉来重建世界;在无法精确测距的时候,应该像经验丰富的船长一样,用相对运动和群体行为来判断安全。"

    这种在信息不完备中依然保持认知能力的特性,被李德毅称为"认知的韧性"。它恰恰是认知螺旋的产物:一个只在顺境中训练的系统,缺乏在逆境中重组认知结构的经验;而一个经历过多种恶劣情境、在摔倒和恢复中完成过认知螺旋的系统,会发展出更丰富的抽象结构和更灵活的联想能力,从而在面对未知挑战时表现出韧性。

    九、机器驾照:一种新的人机契约

    郑开大道测试的成功,以及后续在恶劣天气和复杂城市场景中的持续验证,让李德毅开始思考一个更宏观的问题:当机器能够像人一样参与道路交通,我们如何评估它的能力?传统的车辆检测标准——制动距离、转向精度、灯光亮度——显然不够。我们需要一种认知层面的评估标准

    李德毅提出了"机器驾照"的构想。这不是把人类的驾照考试简单移植给机器,而是设计一套全新的、针对机器认知能力的测试体系。

    人类的驾照考试主要考察两部分:规则知识(科目一)和操作技能(科目二、三)。但机器的规则知识可以完美背诵,操作技能可以精确到毫米。这种考试对机器没有意义,就像让一位数学博士去参加小学算术竞赛。

    机器驾照应该考察什么?李德毅认为,应该考察三个层次:

    第一层:路权理解力。不是考察机器是否知道"红灯停绿灯行",而是考察它在没有信号灯的路口、在标线模糊的路段、在拥堵的合流区,能否像社会成员一样协商路权。测试场景应该包括:两辆无人车同时到达无信号灯路口,它们如何决定谁先走?一辆社会车辆违规加塞,无人车如何既保护安全又避免过度反应导致次生拥堵?

    第二层:情境判断力。不是考察机器能否识别"行人"和"车辆",而是考察它能否理解这些目标在特定情境中的意图和预期。比如,一个行人站在路边,低头看手机,他的路权状态是什么?如果他在斑马线前停下脚步,抬头看车,状态又如何变化?一个骑自行车的人在机动车道边缘摇摆,他是技术不佳还是准备变道?这些判断没有唯一正确答案,但有合理的行为区间——这正是云模型的用武之地。

    第三层:认知韧性。不是考察机器在理想条件下的表现,而是考察它在感知降级、规则冲突、意图不明的逆境中,能否保持安全和效率的平衡。比如,在暴雨中车道线消失,高精地图与实时感知冲突,前方车辆行为异常——机器能否像人类老司机一样,依靠经验和直觉(OOA),结合规则和推理(OODA),做出合理的降级决策?

    李德毅强调,机器驾照不应该是一次性的"通过/不通过"判定,而应该是一个持续的、动态的评估过程。就像人类司机的驾驶记录会影响保险费率,机器的驾驶历史——它的路权协商成功率、它的紧急制动频率、它引发的后车反应——也应该被持续追踪。这种追踪不仅是对机器的约束,更是机器认知螺旋的反馈来源:它在真实世界中的表现数据,回流到驾驶脑的结构中,驱动它的自成长。

    机器驾照的构想,本质上是在建立一种新的人机契约。当机器的认知能力达到足以参与社会活动的水平时,社会必须发明新的制度来接纳它、规范它、评估它。这不是技术问题,而是文明问题。它要求我们重新思考:什么是"合格"的驾驶者?什么是"安全"的交通?什么是"智能"的边界?

    十、尾声:空塑料袋的归来

    让我们回到那个一切开始的地方。

    2025年的一个清晨,北京五环路上。那辆曾经因为空塑料袋而急刹的测试车,已经升级到了第九代驾驶脑。它的传感器依然精密,但它的认知架构已经脱胎换骨。

    当那只白色的空塑料袋再次从前方卡车的货厢边缘脱落,翻滚着飘向车道时,驾驶脑的认知层开始运转。它首先识别出物体的物理特征:白色、轻质、不规则形状、受风影响的轨迹。但这一次,它不仅仅是在做"障碍物分类"。它的路权认知图显示:当前车道前方五十米内无其他威胁,左侧车道有社会车辆但距离足够,右侧是应急车道。它的云模型评估:该物体落在"危险"云的边缘区域——隶属度约为零点二,属于"需关注但无需紧急反应"的范畴。它的具身交互预期:急刹会导致乘客不适和后车风险,而轻点刹车、微调方向即可安全通过。

    零点三秒后,车辆做出了决策:没有刺耳的刹车声,没有剧烈的减速,只是像水流绕过石头一样,自然地调整了轨迹。车内的人类安全员甚至没有从手机上抬起头。

    那只空塑料袋在车窗外飘过,继续它的旅程,最终落在路边的绿化带里。驾驶脑把这个事件存入记忆:一次成功的低风险规避,一次路权状态的轻微扰动,一次软硬构体的协同验证。这个记忆不会立即改变它的行为模式,但它会像一粒沙子落入牡蛎,在未来的某个时刻,与其他经验共同沉淀为一层新的认知结构。

    李德毅在远处的办公室里,通过数据回传看到了这一幕。他没有微笑,只是轻轻点了点头。他知道,这不仅仅是一次技术改进。这是一个认知系统开始理解世界的质地——风的重量、袋子的空虚、以及那种叫做"从容"的驾驶美德。

    从西直门立交桥的"死机",到郑开大道的历史性穿越,从暴雨中的认知韧性,到空塑料袋前的从容绕过——这是一条漫长的道路。它穿越的不仅是地理空间,更是认知的无人区。在这条路上,李德毅和他的团队用驾驶脑证明了一件事:机器可以不仅仅计算,它可以开始理解;可以不仅仅执行,它可以开始协商;可以不仅仅存在,它可以开始栖居

    而那只空塑料袋,像一位沉默的考官,还在五环路上的风中飘舞。它等待着下一辆经过的车,等待着下一个认知系统的回答。有些车会继续急刹,有些车会从容绕过。每一次回答,都在书写着智能驾驶的未来——不是作为技术的未来,而是作为认知的未来

    在下一章,我们将离开方向盘,走进另一个更为当下的战场:大模型的评估。我们将看到,当认知物理学的四要素框架被用来审视GPT-4这样的庞然大物时,那些令人惊叹的能力背后,隐藏着怎样的认知盲区。一只空塑料袋可以检验自动驾驶的"理解",那么,什么能检验大模型的"理解"?答案,或许比想象中更令人警醒。



https://blog.sciencenet.cn/blog-41701-1536559.html

上一篇:李德毅院士的认知物理学 第七章 认知螺旋:机器也能"成长"吗?
下一篇:物理学的隐秘之地
收藏 IP: 111.27.171.*| 热度|

8 刘进平 宁利中 郑永军 崔锦华 雒运强 高宏 杨正瓴 聂广

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-5-30 02:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部