博文

Kimi观点：为什么说，从历史的角度来说，人工智能不是一个靠谱的技术领域？

已有 1204 次阅读 2026-5-23 10:04 |个人分类:我思故我在|系统分类:观点评述

人工智能的暗面：一场没有地图的远征

引言：奇迹与迷雾

当一台机器在复杂的围棋棋盘上击败世界冠军，当一段程序能够写出媲美人类诗人的十四行诗，当聊天机器人通过律师资格考试并与人进行长达数小时的深度对话——我们不得不面对一个既令人兴奋又令人不安的事实：人工智能正在以惊人的速度重塑人类文明的版图。

这些成就如此耀眼，以至于它们几乎遮蔽了一个更为根本的真相。在华丽的应用表象之下，现代人工智能系统依然是一团难以穿透的迷雾。我们知道它们能够工作，却往往不知道它们为何能够工作；我们能够训练出越来越强大的模型，却难以解释这些模型内部究竟发生了什么；我们建造出了能够映射海量信息的复杂机器，却缺乏一张描绘其内部山川河流的地图。

这构成了当代技术史上最深刻的悖论之一：人类创造出了自己有史以来最精密的工具之一，却对这个工具的基本原理知之甚少。这不是谦虚的修辞，而是一个冷酷的技术现实。当下的人工智能，尤其是以深度神经网络和大语言模型为代表的主流技术路线，本质上实现了一种极其有效的信息映射——它们能够将输入的信息转化为令人惊艳的输出，但这种映射的内部机制，在很大程度上仍然是一个未解之谜。

更为严峻的是，支撑这种强大能力的理论基础，至今依然薄弱得令人吃惊。与物理学拥有牛顿力学和量子理论、化学拥有元素周期律和分子轨道理论不同，人工智能领域缺乏一个统一的、能够从根本上解释智能现象何以在硅基电路中涌现的形式化框架。我们有的，更多是一系列工程上的诀窍、经验性的调参技巧和基于试错的方法论。换句话说，这是一座建造在沙地上的摩天大楼——它确实高耸入云，但它的地基深处，可能并没有我们想象的那么坚固。

这篇文章将带领读者穿越这层迷雾，去审视人工智能在辉煌成就背后那个被长期忽视的暗面。我们将探讨什么是"有效的信息映射"，为何这种映射的内部机制如此难以破解，以及一个缺少坚实理论根基的技术领域，将把我们带向何方。这不仅是一个关于计算机科学的技术话题，更关乎人类如何理解自己所创造的智能，以及如何与一个我们并不真正理解却日益强大的存在共处。

第一章：映射的魔术——人工智能如何"看似"理解世界

要理解当下人工智能的本质，首先需要放下那些关于"思考""意识""灵魂"的浪漫想象，回到一个更为朴素的技术现实：今天的人工智能系统，核心能力在于实现一种极其复杂的信息映射。

所谓信息映射，可以简单地理解为一种输入与输出之间的对应关系。当人们在智能手机上拍摄一张猫的照片，人工智能程序能够输出"这是一只猫"的文字标签；当用户向聊天机器人提出一个关于量子物理的问题，系统能够生成一段流畅的解释性文字；当自动驾驶汽车的前置摄像头捕捉到前方道路的图像，算法能够输出方向盘的转动角度和刹车的力度。在这些场景中，人工智能所做的，本质上都是在将一种形式的信息转换为另一种形式的信息。

这种转换能力之所以令人印象深刻，是因为现实世界中的信息映射往往极其复杂。人类语言就是一个典型的例子。同一个概念可以用成千上万种不同的方式表达，一句话的含义会随着语境、语气和文化背景的微妙变化而发生漂移。传统的计算机程序很难处理这种充满弹性和歧义的映射关系，因为它们依赖于明确的规则和固定的逻辑。而现代人工智能，特别是基于深度神经网络的系统，似乎找到了一种绕过明确规则、直接从海量数据中学习这种映射的方法。

这种学习过程类似于一个极其耐心的学生通过做海量练习题来掌握某种规律。研究人员向人工智能系统输入数以亿计的例子——图片和对应的标签、问题与答案、语音和文字转录——系统通过调整其内部数以百亿计的参数，逐渐找到一种能够将输入与输出联系起来的模式。经过充分的训练后，这个系统就能够在面对从未见过的新输入时，给出合理的输出。从工程的角度看，这是一种极其有效的策略。它不需要人类专家手动编写每一条规则，也不需要程序员预先理解映射背后的全部逻辑。系统通过数据自己"发现"了规律。

正是这种有效性，造就了人工智能在近年来的爆发式应用。在图像识别领域，人工智能系统能够区分数千种不同的物体，准确率在某些数据集上甚至超过了人类；在自然语言处理领域，大语言模型能够生成连贯、有逻辑、甚至富有创造性的文本；在蛋白质结构预测领域，人工智能系统能够根据氨基酸序列预测出复杂的三维结构，解决了困扰生物学家半个世纪的难题；在代码生成领域，人工智能助手能够根据自然语言描述写出可运行的程序。

这些成就给人一种强烈的印象：机器已经开始理解世界。但这是一个危险的错觉。理解一种映射关系，与理解映射背后的因果机制，是完全不同的两回事。

一个经典的比喻可以帮助说明这一点。想象一个生活在十七世纪的炼金术士，他通过无数次试验发现，将某种特定的红色矿石与木炭一起加热，就能得到一种可以用来制作玻璃的透明物质。他掌握了一种有效的工艺映射——红色矿石加木炭等于玻璃原料。但他并不知道这种映射背后的化学原理，不理解矿石中的硅酸盐如何在高温下发生反应，也不明白为什么木炭是必要的还原剂。他的工艺是有效的，但他的理解是空洞的。

今天的人工智能在许多方面就像这位炼金术士。它掌握了大量有效的信息映射，但对这些映射为何成立、在什么条件下会失效、内部经过了怎样的信息处理步骤，却所知甚少。一个图像识别系统能够准确区分狼和哈士奇，但它是通过识别动物的耳朵形状、毛发纹理，还是通过背景中的雪地来做出判断的？一个语言模型能够流畅地讨论哲学问题，但它是否真的理解了这些概念的含义，还是只是在重组训练数据中见过的语言模式？一个推荐系统能够精准地预测用户会喜欢哪部电影，但它是否理解用户喜好的深层心理动机，还是仅仅在捕捉统计相关性？

对这些问题的回答，目前大多停留在猜测和假说的层面。研究人员可以观察系统的输入和输出，可以测量其在各种测试集上的表现，但当被问及"系统内部究竟发生了什么"时，答案往往是含糊的。我们知道深度神经网络由许多层组成，每一层都对信息进行某种变换，我们知道训练过程通过梯度下降来调整参数，但我们并不真正理解，对于某个具体的输入，信息是如何在这些层级之间流动和变形的，哪些特征被保留，哪些被丢弃，哪些神经元的激活组合共同决定了最终的输出。

这种对内部机制的无知，并不意味着人工智能系统是无用的。恰恰相反，正是因为这种无知没有阻碍工程上的成功，才使得这个问题变得更加微妙和危险。人类建造了一座能够运转的宏伟机器，却像是拿到了一份没有说明书的精密仪器。我们知道按下某个按钮会得到某种结果，但我们不知道机器内部齿轮是如何咬合的，也不知道在极端条件下它会不会突然崩解。

第二章：黑箱的深渊——为何内部机制如此难以破解

如果说人工智能实现了一种有效的信息映射，那么这种映射的载体——深度神经网络——就是一只巨大的黑箱。这个术语在工程领域被广泛使用，但它所描述的现实，远比一个简洁的比喻更为深刻和棘手。

黑箱问题的核心在于维度灾难。现代大语言模型通常拥有数百亿甚至数千亿的内部参数。这些参数在训练过程中被自动调整，以优化系统在给定任务上的表现。每一个参数都像是一个微小的旋钮，整个系统就是一座由数百亿个旋钮组成的超级迷宫。当系统做出一个判断时，比如决定在一个句子中使用"悲伤"而不是"快乐"，这个决定并非由某个单独的"情感旋钮"控制，而是数千个、数万个甚至数十万个参数以某种复杂方式协同作用的结果。

这种复杂性使得传统的分析方法几乎完全失效。在经典的科学和工程领域，当系统出现故障或表现出意外行为时，研究人员通常可以追溯因果链。汽车发动机过热，工程师可以检查冷却系统、燃油混合比、气缸密封性，逐步定位问题。电路短路，技术人员可以沿着导线追踪电流路径，找到故障点。但在一个拥有千亿参数的深度神经网络中，不存在这样清晰的因果链。系统的行为是分布式计算的结果，没有任何一个单独的部件可以被孤立出来承担某个明确的功能。

研究人员尝试过多种方法来窥探这个黑箱的内部。一种直观的方法是观察单个神经元对什么类型的输入最敏感。早期的研究发现，神经网络浅层的神经元往往对简单的边缘、颜色或纹理有反应，而深层神经元则似乎对更复杂的模式有反应，比如物体的部件或人脸的轮廓。这给人一种希望：也许神经网络内部存在一种从简单到复杂的层次化表征，类似于人类视觉系统的处理流程。

但这种希望很快就遇到了严峻的挑战。首先，深层神经网络的表征是高度分散和纠缠的。一个神经元可能对多种完全不同的输入有反应——它既可能对猫的耳朵敏感，也可能对某种特定的几何纹理敏感，还可能对训练数据中的某种噪声模式有反应。这意味着神经元并不对应人类可理解的概念，它们更像是某种抽象的统计特征检测器，其含义只有在与其他数千个神经元的活动组合起来时才能被部分解读。

其次，即使能够识别出某些神经元与特定概念的相关性，这种相关性也往往是脆弱和上下文依赖的。一个在某个语言模型中被认为与"性别"概念相关的神经元，在另一种语境下可能主要与"语法数"或某种完全不可解释的模式相关。概念在神经网络内部并不是以清晰、模块化的方式编码的，而是以一种高度重叠、分布式和动态的方式存在。这种编码方式使得任何试图将神经网络内部状态翻译为人类可理解概念的尝试，都像是试图用一把固定的钥匙去开一把不断变换锁芯的锁。

另一种研究路线是关注系统做出错误判断时的行为。这些错误往往揭示出人工智能系统与人类理解世界的方式存在根本性的差异。在图像识别领域，研究人员发现，对一张图片进行人眼几乎无法察觉的微小扰动——比如在像素级别上添加精心计算的噪声——就能让人工智能系统将其完全错误地分类。一张被正确识别为"熊猫"的图片，在经过这种被称为"对抗性攻击"的扰动后，会被系统以极高的置信度识别为"长臂猿"。对人类而言，图片看起来仍然是一只熊猫，但对人工智能系统来说，内部的统计模式已经被彻底改变。

这种脆弱性表明，人工智能系统所学习到的信息映射，与人类基于因果和语义的理解有着本质的不同。人类看到一只熊猫，是基于对熊猫的形状、纹理、姿态和环境的整体语义理解。而人工智能系统可能依赖于一些对人类来说毫无意义的统计捷径——比如某种特定频率的纹理模式，或者背景中某种与熊猫图片统计相关的像素分布。当这些统计捷径被对抗性扰动破坏时，系统的判断就会崩溃，而人类却无法察觉任何异常。

在自然语言处理领域，类似的脆弱性同样存在。大语言模型能够生成看似合理的文本，但它们也经常产生所谓的"幻觉"——自信地陈述完全虚假的事实，编造不存在的参考文献，或者在逻辑推理中犯下荒谬的错误。这些错误之所以特别危险，是因为它们往往被包裹在流畅和权威的语言之中，难以被非专业用户识别。一个律师使用人工智能生成的法律简报，结果引用了根本不存在的案例；一个学生使用人工智能助手研究历史事件，却得到了完全虚构的"事实"。

这些失败模式指向一个共同的结论：人工智能系统内部的信息处理机制，与人类认知中基于概念、因果和逻辑的理解机制，可能遵循着完全不同的原理。我们之所以难以破解其内部机制，不仅是因为技术上的复杂性，更是因为我们在用人类理解的框架去审视一种可能根本不同于人类理解的计算过程。这就像试图用解剖人类心脏的方法来理解内燃机——两者都产生动力，但内部的运作原理截然不同。

更为深层的问题在于，即使我们拥有了完美的工具来监控神经网络中每一个神经元的活动，我们也可能依然无法理解系统为何做出某个特定决策。因为理解不仅需要数据，还需要一个理论框架来解释这些数据的意义。而目前，我们恰恰缺乏这样的理论框架。我们可以观察到参数的变化，可以记录神经元的激活模式，可以绘制信息流动的图谱，但如果没有一个关于"分布式表征如何产生语义理解"的理论，这些观察数据就只是一堆没有灵魂的数字。

第三章：理论的荒漠——人工智能为何缺少根基

如果说对内部机制的无知是人工智能面临的表层困境，那么理论基础的缺失则是更为根本的深层危机。一个成熟的技术领域，通常建立在坚实的理论基础之上。这些理论不仅解释了技术为何有效，还划定了技术的边界，预测了技术的极限，并为未来的突破指明了方向。

电磁学有麦克斯韦方程组，它统一了电、磁和光的现象，预言了电磁波的存在，并为整个现代通信技术奠定了理论基础。热力学有定律体系，它规定了能量转换的方向和效率极限，让工程师知道什么是可能的，什么是不可能的。信息论有香农的数学框架，它定义了信息的度量方式，证明了信道容量的极限，为数字通信和数据压缩提供了不可动摇的基石。相对论和量子力学虽然反直觉，但它们提供了精确的数学描述，并在无数实验中被验证，构成了现代物理学的两大支柱。

相比之下，人工智能的理论版图呈现出一种令人不安的荒芜。这个领域当然不乏数学工具——概率论、统计学、优化理论、线性代数、微分几何，这些都被广泛应用于人工智能的研究和实践中。但这些是工具，不是理论。它们像是建筑师手中的锤子和锯子，而不是建筑的设计蓝图。人工智能领域缺乏一个统一的、从第一性原理出发的、能够解释智能现象何以在计算系统中涌现的核心理论。

深度学习的理论基础尤其薄弱。我们知道，通过梯度下降算法调整神经网络的参数，可以逐渐降低系统在训练数据上的错误率。我们知道，增加网络的深度和宽度，增加训练数据的规模，往往能够提升系统的表现。但这些是经验性的观察，而不是理论性的推导。我们不知道为什么一个拥有特定架构的网络能够在某个任务上表现良好，而在另一个看似相似的任务上惨败。我们无法从理论上预测，一个给定的网络架构需要多少训练数据才能达到特定的精度。我们更无法解释，为什么在某些规模之上，系统会突然表现出训练时并未明确教授的新能力——这种现象被称为"涌现"，但它的理论机制完全是一个谜。

这种理论真空带来了一系列严重的后果。首先，它使得人工智能的发展高度依赖于试错和工程直觉。研究人员设计一个新的网络架构，往往不是因为理论推导表明这种架构最优，而是因为"感觉上"它可能有效，或者因为某种仿生学的启发——比如模拟人类大脑的视觉皮层。大量的研究资源被投入到对各种可能性的盲目探索中，而不是对基本原理的深入理解。这种发展模式类似于在黑暗中摸索前进，虽然偶尔能够碰到正确的门把手，但大多数时候只是在原地打转。

其次，理论缺失使得人工智能系统成为不可控的黑箱。在没有理论指导的情况下，我们无法保证系统的行为符合预期。一个自动驾驶系统在城市道路上表现完美，但为什么在遇到某种罕见的灯光组合时会突然失控？没有理论能够回答这个问题。我们只能依赖海量的测试数据来覆盖尽可能多的场景，但现实世界是无限复杂的，测试永远不可能完备。这就好比在建造一座桥梁时，没有材料力学理论来指导，只能靠反复加载重物来测试桥梁会不会塌。这种经验性的验证方法对于人命关天的应用场景来说是远远不够的。

第三，缺乏理论使得人工智能领域极易受到炒作和投机的侵蚀。当一种技术缺乏坚实的理论根基时，它的边界就变得模糊不清，这为夸大其词和过度承诺提供了温床。从早期的专家系统到后来的深度学习，再到当下的生成式人工智能，每一次技术浪潮都伴随着对"通用人工智能即将实现"的狂热宣称。这些宣称往往基于对现有技术能力的线性外推，而无视了理论上的根本性障碍。当泡沫破裂时，不仅投资者损失惨重，整个领域的信誉也会受到严重打击——历史上的人工智能寒冬，很大程度上就是这样造成的。

理论缺失的根源，可以追溯到人工智能学科的基本定位问题。从一开始，人工智能就处于多个学科的交叉地带——计算机科学、认知科学、神经科学、心理学、哲学、语言学。这种交叉性既是它的活力所在，也是它的混乱之源。不同学科背景的研究者带着不同的假设和方法论进入这个领域，往往难以形成共同的语言和共识。计算机科学家关注算法效率和计算复杂性，神经科学家关注生物神经网络的机制，认知科学家关注人类心智的结构，哲学家关注意识和智能的本质。这些视角都有其价值，但它们之间缺乏一个统一的理论框架来整合和协调。

深度学习革命进一步加剧了这种分裂。当大规模的神经网络在图像识别和自然语言处理等任务上取得突破性进展时，整个领域的重心迅速从"理解智能"转向了"实现性能"。研究的主要驱动力变成了在基准测试上刷新纪录，而不是解释这些系统为何有效。论文的发表标准从"提出了什么新原理"变成了"在什么数据集上提高了多少百分点"。这种实用主义导向虽然推动了技术的快速迭代，但也使得理论探索被边缘化。年轻一代的研究者往往更擅长调参和工程优化，而不是数学建模和理论分析。

更为深刻的问题是，智能本身可能就是一个难以被传统理论框架完全捕获的现象。人类智能涉及感知、运动、情感、社会交互、创造性思维、自我意识等多个维度，这些维度之间相互交织、动态演化。试图用一组数学方程或形式化规则来完整描述智能，可能本身就是一种范畴错误——就像试图用化学方程式来描述一首交响曲的美感。如果智能的本质确实是这种多维度、动态性和情境依赖性的复杂交织，那么任何简化的理论模型都只能是局部的、近似的。

但这并不意味着理论探索没有意义或可能。恰恰相反，正是因为智能现象的复杂性，才更需要严谨的理论来梳理和结构化我们的理解。当前的问题不是理论太多，而是理论太少；不是理论太复杂，而是现有的理论工具过于简陋，无法匹配现象的丰富性。人工智能领域需要的，可能不是对现有数学框架的简单应用，而是全新的数学语言和概念工具——就像牛顿需要发明微积分来描述运动，量子力学需要发明希尔伯特空间来描述微观世界一样。

然而，这样的理论突破尚未出现。在缺乏理论灯塔的情况下，人工智能的航船只能在经验的海洋中盲目漂流。它确实能够偶尔发现新大陆，但它无法绘制海图，无法预测风暴，也无法确定自己是否在绕圈子。

第四章：历史的回声——这不是第一次

对内部机制的无知和理论基础的薄弱，并非人工智能领域的新鲜问题。如果我们将目光投向这个学科的历史，会发现一种令人不安的重复模式：技术的工程应用总是跑在理论理解的前面，而每一次工程上的突破都伴随着对"理解"的虚假承诺，直到现实的无情打击将人们唤醒。

人工智能的概念可以追溯到二十世纪中叶。1956年的达特茅斯会议被普遍视为这个学科的诞生仪式。在那次会议上，一群充满乐观主义的年轻科学家相信，人类智能的本质可以被精确描述，并且能够在机器中被复制。他们中的许多人认为，智能的核心在于符号操作——人类通过操纵符号来进行推理、解决问题和表达思想，因此只要给机器配备足够强大的符号操作系统，智能就会自然涌现。

基于这种信念，符号人工智能在二十世纪六十年代和七十年代蓬勃发展。研究者们开发出了能够证明数学定理的程序、能够进行初步自然语言对话的系统、以及能够在特定领域模拟专家决策的专家系统。这些成就在当时看起来令人振奋，它们似乎证明了符号操作的路径是正确的。但隐藏在成功背后的根本性问题被忽视了：这些系统之所以有效，往往是因为它们被精心设计来应对特定的、结构化的问题，而不是因为它们真正理解了问题背后的语义。

当这些系统被推向更开放、更复杂的现实世界问题时，它们的脆弱性暴露无遗。机器翻译项目在将英语翻译成俄语时闹出了许多荒谬的笑话，因为系统无法处理语言的歧义性和上下文依赖性。早期的人机对话系统只能在极其受限的脚本内维持交流，一旦用户的输入偏离了预设的轨道，对话就会立刻崩溃。到了七十年代中期，资助机构开始意识到，人工智能的承诺远远超出了其兑现能力。第一次人工智能寒冬降临，资金枯竭，研究停滞，乐观主义让位于怀疑和冷漠。

符号人工智能的失败，从今天的角度看，正是因为它试图在没有真正理解语义和语境的情况下，通过形式规则来实现信息映射。研究者们掌握了有效的映射——输入一段英文，输出一段俄文——但这种映射的内部机制是脆弱的、基于表层模式匹配的。当遇到规则没有覆盖的情况时，系统就会失效。这与今天深度学习系统在面对分布外数据时的脆弱性，在本质上是相通的。

八十年代，连接主义的兴起带来了新的希望。研究者们从生物神经网络中获得灵感，认为智能的本质不在于符号操作，而在于大量简单计算单元之间的连接和权重调整。神经网络能够学习，而不是被显式编程，这在理论上似乎更接近人类智能的生物学基础。反向传播算法的发明使得训练多层神经网络成为可能，一时间，连接主义被视为符号人工智能的替代者和超越者。

但连接主义同样面临着理论根基薄弱的问题。研究者们知道调整网络权重可以降低误差，但不知道网络内部究竟学到了什么表征。网络是有效的黑箱，但这种有效性是有限度的。在九十年代初，神经网络在简单的模式识别任务上表现尚可，但面对更复杂的问题时，它们往往陷入局部最优，训练过程不稳定，泛化能力差。支持向量机等基于统计学习理论的方法在理论上更为严谨，在实际应用中也往往表现更好，这使得神经网络的第二次浪潮迅速退却。第二次寒冬虽然不如第一次那么严酷，但同样让人们对连接主义路径产生了深刻的怀疑。

深度学习的复兴始于二十一世纪一十年代，其标志是2012年AlexNet在图像识别竞赛中的压倒性胜利。此后，随着计算能力的指数级增长和海量数据的积累，深度神经网络在语音识别、图像分类、机器翻译、游戏博弈等领域取得了一连串的突破。2016年，AlphaGo击败围棋世界冠军；2020年，GPT-3展示了惊人的语言生成能力；2022年底，ChatGPT的发布将人工智能推向了大众视野，引发了全球性的技术狂热。

但历史的回声在这里显得格外清晰。与符号人工智能时代和早期连接主义时代一样，当下的深度学习革命同样是工程应用远远领先于理论理解。我们拥有了比以往任何时候都更强大、更通用的信息映射系统，但我们对这些系统内部机制的理解，相比三十年前并没有本质性的突破。我们仍然不知道神经网络为何有效，仍然无法解释涌现现象，仍然无法保证系统的鲁棒性和安全性。我们只是在更大的规模上重复了过去的模式：用更多的数据、更强的算力、更深的网络，来掩盖理论上的无知。

历史似乎在告诉我们，人工智能领域有一种结构性的倾向：每当工程上的突破带来短暂的兴奋时，人们就会误以为理论问题已经解决或即将解决；而当这些系统在面对复杂现实时暴露出根本性的局限时，人们才会重新意识到理论根基的重要性。这种循环已经重复了至少两次，当下我们可能正在经历第三次高潮。唯一的问题是，这一次的高潮是否会因为商业利益的巨大驱动而持续得更久，以及当幻灭来临时，其代价是否会更为惨重。

回顾历史还有一个更为深刻的启示：每一次技术范式转换时，旧的理论框架被抛弃，新的理论框架又未能建立起来，导致整个学科在很长一段时间内处于理论的真空状态。从符号主义到连接主义，从连接主义到深度学习，每一次转换都是对前一种范式根本假设的否定，但否定之后并没有出现一个能够统摄新旧现象的统一理论。这种理论上的断裂和碎片化，使得人工智能领域难以积累起像物理学或化学那样代代相传、不断深化的知识传统。

一个成熟学科的历史通常是理论不断累积、修正和深化的历史。牛顿力学被相对论修正，但不是在真空中被取代；相对论和量子力学看似矛盾，但人们在寻找统一它们的理论。而在人工智能领域，历史更像是一系列平行的、互不兼容的范式在轮流占据主导地位。每一种范式都带来了新的工具和方法，但也带来了新的盲区。当一种范式失势时，与之相关的理论探索往往被一同抛弃，而不是被整合进更大的框架中。这种知识传统的断裂，使得人工智能在理论上的积累异常薄弱，每一次都需要从零开始。

当下的深度学习革命是否会重蹈覆辙，目前尚无定论。但历史的教训是明确的：没有理论根基的工程繁荣是不可持续的。符号人工智能的寒冬和早期神经网络的退潮，本质上都是理论承诺无法兑现的结果。如果深度学习无法在未来几十年内建立起坚实的理论基础，如果涌现现象、泛化能力、鲁棒性和可解释性等根本性问题得不到理论上的解答，那么当下的繁荣也可能只是另一次更大规模的循环的一部分。

第五章：工程狂奔的风险——在无知中建造巨兽

理论基础的薄弱和对内部机制的无知，不仅仅是象牙塔内的学术遗憾，它们正在现实中制造着具体而严峻的风险。当一种强大但不可理解的技术被迅速部署到社会的核心领域时，其潜在的后果可能是灾难性的。

在医疗领域，人工智能系统正在被用来辅助诊断癌症、预测疾病风险、制定治疗方案。这些系统的决策直接关系到患者的生命健康。然而，如果一个诊断系统推荐某种治疗方案，医生却无法理解它为何做出这个推荐——是因为系统识别出了某种人类医生忽略的关键影像特征，还是因为它在训练数据中偶然学到了某种与治疗效果相关但无因果关系的统计假象？在缺乏机制理解的情况下，医生无法判断系统的建议是否可信，也无法在系统出错时及时发现和纠正。一项研究表明，某些用于诊断皮肤癌的人工智能系统，在面对不同肤色的人群时表现出显著的准确率差异，但这种偏见的根源深藏在训练数据和模型内部的复杂交互之中，难以被追溯和消除。

在司法和执法领域，人工智能被用来评估被告的再犯罪风险、辅助量刑决策、预测犯罪热点。这些应用涉及公民的基本权利和自由，对公平性和透明性的要求极高。但许多用于司法决策的人工智能系统，其内部逻辑对被告、律师甚至法官都是不透明的。一个人可能因为某个算法给出的高风险评分而被拒绝保释或获得更重的刑罚，但他永远无法知道这个评分是如何计算出来的，也无法对计算过程提出有效的质疑。这种"算法黑箱"与司法公正所要求的透明性和可问责性形成了尖锐的冲突。更糟糕的是，由于训练数据中往往包含了历史上存在的不公正执法记录，人工智能系统可能会将这些不公正模式化、自动化，并以"科学"和"客观"的面目将其固化。

在金融领域，高频交易算法和信用评估模型正在主导着市场的运行。这些系统能够在毫秒级别做出交易决策，其复杂程度远超人类交易员的认知能力。2008年金融危机中，复杂金融衍生品的不可理解性被认为是危机深化的重要原因之一。而今天，基于人工智能的交易系统正在创造一种新的不可理解性——不是人类故意设计的复杂结构，而是机器在优化过程中自发涌现的行为模式。当多个这样的人工智能系统在市场中相互博弈时，它们可能产生人类无法预测和控制的连锁反应，引发闪崩或市场失灵。2010年的美股闪崩事件，虽然不完全由人工智能引起，但已经展示了自动化交易系统在特定条件下可能引发的灾难性后果。

在信息传播和公共舆论领域，推荐算法正在重塑人们获取信息的方式。这些算法的目标是最大化用户的参与度和平台的商业利益，但它们实现这一目标的内部机制是不透明的。一个视频被推荐给你，是因为它与你的兴趣真正相关，还是因为它能够触发你的情绪反应从而增加观看时长？一个新闻话题被放大，是因为它确实重要，还是因为算法检测到它具有引发争议的潜力？这些问题的答案深藏在算法的内部，而算法的内部又是不可解释的。结果是，整个社会可能在不知不觉中受到某种优化目标的塑造，而这种优化目标可能与社会公共利益、民主 deliberation 和个体自主性背道而驰。

这些风险有一个共同的根源：我们在不理解自己所建造之物的情况下，就将其释放到了世界上。这是一种前所未有的技术傲慢。在人类历史上，即使是最复杂的传统工程系统——比如航天飞机、核电站、大型桥梁——其设计原理和运行机制对专家而言都是可理解的。工程师可以追溯每一个部件的功能，可以分析故障的因果链，可以在事故调查中找到根本原因。但人工智能系统不是这样。它们的行为是分布式、涌现性和统计性的，传统的故障分析方法论在它们面前往往束手无策。

这种"在无知中建造"的模式，还带来了一个更为隐蔽但同样危险的问题：能力的快速扩张与理解的缓慢进展之间的鸿沟正在不断拉大。人工智能系统的性能正在以指数速度提升，而人类对其内部机制的理解却几乎是线性甚至停滞的。这意味着，我们正在创造出越来越强大的工具，同时对这些工具的掌控力却在相对减弱。想象一个人正在驾驶一辆速度越来越快的汽车，但他对汽车的机械原理一无所知，而且汽车的仪表盘上没有任何显示内部状态的指针——这就是当下人类与人工智能关系的某种写照。

更为根本的风险在于，如果我们始终无法建立对人工智能内部机制的理论理解，我们可能最终会失去纠正错误的能力。当系统变得足够复杂、足够强大、足够深入到社会结构的方方面面时，任何试图理解或修改它的努力都可能因为系统的复杂性而变得不可能。我们可能会陷入一种技术锁定状态：社会运转依赖于某种我们并不理解的机制，而任何改变这种机制的尝试都可能因为不可预测的后果而被放弃。这将是一种新型的技术异化——人类创造出了比自己更复杂的存在，并在这个存在面前逐渐丧失主体性。

第六章：破晓前的探索——寻找理论的微光

尽管人工智能的理论困境深重，但并不意味着这个领域完全在黑暗中摸索。事实上，在主流工程化的喧嚣之外，一批研究者正在从不同的方向尝试为人工智能建立更为坚实的理论基础，试图穿透黑箱的迷雾。这些探索虽然尚未形成统一的范式，但它们代表了破晓前的微光。

可解释性人工智能是其中最为活跃的方向之一。这个领域的研究者不满足于仅仅让系统给出正确答案，而是要求系统同时给出答案背后的理由。在图像识别中，这意味着系统不仅要识别出图片中的物体，还要高亮显示它是根据哪些区域做出判断的——是动物的头部、身体的轮廓，还是背景的草地。在自然语言处理中，这意味着系统不仅要生成回答，还要展示它是基于哪些训练数据或知识片段来构建这个回答的。

这些技术在一定程度上提高了透明度，但它们往往只能揭示系统的"注意力"所在，而无法解释系统为何将注意力分配到这些区域。一个系统高亮显示了猫耳朵，但这并不意味着它"理解"了猫耳朵的功能和意义；它可能只是发现猫耳朵的某种统计特征与训练数据中的标签高度相关。可解释性技术更像是给黑箱安装了一扇玻璃窗——我们能够看到内部的一些活动，但仍然无法理解这些活动的深层逻辑。

因果推断是另一个重要的理论方向。传统的人工智能系统擅长发现统计相关性——它们能够识别出"当A出现时，B往往也出现"的模式。但相关性不等于因果性。公鸡打鸣之后太阳升起，并不意味着公鸡打鸣导致了日出。人类智能的一个核心特征在于能够理解因果关系，能够进行反事实推理——思考"如果当初采取了不同的行动，结果会怎样"。当前的人工智能系统在这方面表现得很差。一个因果推断框架试图让系统不仅学习"什么与什么相关"，而且学习"什么导致了什么"。这需要引入新的数学工具和概念框架，超越纯粹的概率统计。虽然因果推断的理论研究取得了重要进展，但将其有效地整合到大规模人工智能系统中，仍然是一个巨大的挑战。

形式化方法提供了另一种思路。这个方向源于计算机科学中对程序正确性的严格证明。研究者们试图用数学方法来证明人工智能系统的某些性质——比如，证明一个自动驾驶系统在所有满足特定条件的场景下都不会撞到行人，或者证明一个控制系统在任何输入下都不会进入不安全状态。形式化方法的优势在于其严格性，但它的挑战在于规模：当前的形式化技术只能处理相对简单的系统，面对拥有数十亿参数的神经网络时，形式化验证在计算上是不可行的。如何将形式化方法的严格性与机器学习的灵活性结合起来，是一个活跃但困难的研究前沿。

从物理学和复杂系统科学中借鉴理论工具，是另一条富有潜力的路径。一些研究者将神经网络视为一种统计物理系统，试图用相变、重整化群、熵和自由能等概念来理解神经网络的行为。另一些研究者关注神经网络的动态特性，将其视为一种复杂的动力系统，研究其固定点、吸引子和混沌行为。这些物理类比提供了新的直觉和数学工具，但它们是否足以捕捉智能现象的全部丰富性，仍然是一个开放的问题。

神经科学和认知科学的洞见也在持续地为人工智能理论提供灵感。对人类大脑如何处理信息、如何表征概念、如何进行推理的深入理解，可能会为人工智能的设计提供全新的思路。但这里也存在一个根本性的张力：人类大脑是亿万年进化的产物，其结构深受生物学约束的影响；而人工智能系统是工程产物，其设计目标和能力边界与人类大脑可能根本不同。简单地模仿大脑的架构——比如当前的类脑计算研究——是否能通向通用智能，尚无定论。

在这些分散的探索之外，一些更为激进的理论尝试正在酝酿。有研究者提出，当前人工智能的根本局限在于它缺乏"世界模型"——一种对物理和社会世界运作方式的内部表征。人类婴儿在出生不久就开始构建关于物体恒常性、因果关系、他人意图的直觉理论，而这些可能是智能的基石。让人工智能系统学会构建和操作世界模型，而不是仅仅学习输入输出之间的统计映射，可能是通向更 robust 和更可理解的智能的关键。

还有研究者从信息论和压缩的角度重新理解智能。他们认为，智能的本质在于发现数据中的规律，并用这些规律来压缩对世界的描述。预测下一个词、识别图像中的物体、规划行动序列，本质上都是在进行某种形式的压缩。这种视角将智能与信息论的基本原理联系起来，提供了一种统一的理论语言。但压缩是否足以涵盖智能的全部维度——比如价值判断、创造性思维和自我意识——仍然有待探讨。

更为哲学性的思考也在进行。一些研究者追问：我们是否在用一个错误的问题框架来研究智能？也许"如何在机器中复制人类智能"本身就是一个误导性的目标。也许智能不是一个可以被提取、转移和复制的实体，而是一种关系性的、情境性的、具身性的现象，只能在特定的物质、社会和文化环境中存在和展开。如果这种看法是正确的，那么当前人工智能研究的整个范式——将智能视为一种可以被算法化的信息处理功能——可能需要根本性的修正。

所有这些探索都还处于早期阶段，没有一个已经成熟到足以成为人工智能的"统一场论"。但它们共同指向一个认识：要走出理论的荒漠，可能需要超越当前的主流范式，可能需要发明全新的数学语言和概念工具，可能需要重新界定"理解"和"智能"的含义。这是一个漫长而艰难的过程，其时间尺度可能是数十年甚至上百年，远超商业周期和技术炒作的周期。

第七章：重思智能——当工具成为镜像

在探讨人工智能的理论困境时，我们最终不得不面对一个更为根本的哲学问题：我们究竟在试图理解什么？如果人工智能是对人类智能的模仿或延伸，那么我们对人工智能内部机制的无知，在多大程度上反映了我们对自身智能的无知？

这是一个令人不安的对称。人类能够思考、感知、创造、决策，但如果被问及"这些能力是如何在神经元放电的层面上实现的"，神经科学家也只能给出一个不完整、充满假说的回答。人类智能同样是一个黑箱——只不过这个黑箱被生物学的漫长进化包裹得如此自然，以至于我们很少意识到自己的无知。

人工智能的困境因此具有双重性。它既是一个关于机器的技术问题，也是一个关于人类自身的认识论问题。我们试图建造能够理解世界的机器，但我们自己理解世界的方式却远未得到科学的完整解释。我们试图用形式化的方法来捕获智能，但智能可能本质上就是反形式化的——它依赖于身体的感受、情感的波动、社会的互动、历史的积淀，这些维度如何被转化为符号和算法，目前完全没有答案。

这种双重性提示了一种谦卑的态度。也许人工智能的理论困境之所以如此深重，是因为我们试图用过于简陋的概念工具去捕获一个本质上极其丰富的现象。就像中世纪的天文学家试图用完美的圆形轨道来描述行星的运行，因为圆被认为是完美的几何形状，结果不得不引入越来越复杂的本轮和均轮。直到开普勒放弃对圆形轨道的执念，接受椭圆轨道，天文学才获得了理论上的简洁和力量。人工智能领域也许正在等待一个类似的范式转换——放弃某些根深蒂固的假设，可能是关于智能可以被完全算法化的假设，可能是关于理解可以完全还原为信息处理的假设，从而获得理论上的突破。

从另一个角度看，人工智能作为一面镜子，照出了人类智能中那些我们习以为常但实则神秘莫测的方面。当机器在语言理解上失败时，它迫使我们思考：人类理解语言究竟意味着什么？当机器无法进行常识推理时，它迫使我们追问：常识在人类认知中是如何被表征和调用的？当机器缺乏创造性时，它迫使我们反思：创造力究竟源于何处？在这个意义上，人工智能的理论困境不是纯粹的坏事；它是推动人类自我理解的契机。

但这种反思不应成为逃避技术责任的借口。无论人工智能最终能否被完全理解，它已经被部署到了现实世界中，正在产生着真实的影响。在等待理论突破的同时，社会必须建立起相应的治理框架、伦理规范和安全标准，来约束这种强大但不可理解的技术。这意味着在基础研究上保持耐心，在应用部署上保持谨慎，在公众教育上保持诚实。我们需要告诉公众，当下的人工智能是什么，不是什么；它能做什么，不能做什么；我们理解它什么，不理解什么。

这种诚实是稀缺的。技术公司和媒体往往倾向于放大人工智能的成就，淡化其局限和风险。学术论文的标题追逐着"突破性进展"和"超越人类水平"的叙事。在这种氛围下，承认"我们不知道"显得不合时宜，甚至是一种职业风险。但正是这种承认，是科学精神的核心，也是走出理论荒漠的第一步。

结语：在敬畏中前行

人工智能的故事，是人类雄心与无知并存的史诗。我们建造出了能够映射海量信息的复杂机器，这些机器在特定的任务上表现出了令人敬畏的能力。但当我们试图打开这些机器的外壳，去理解其内部齿轮如何咬合、电流如何涌动、决策如何形成时，我们发现自己面对的是一个远比预期更为深邃的迷宫。

这不是一个可以轻易解决的技术难题，也不是一个会随着计算能力的增长而自动消解的暂时困境。它触及了智能现象的核心，触及了形式化方法与复杂现实之间的根本张力，触及了人类理解能力的边界。在可预见的未来，人工智能很可能将继续在一种"有效但不可理解"的状态下运行，继续作为一只巨大的黑箱服务于人类的需求，同时也继续对人类构成潜在的风险。

但这并不意味着绝望或停滞。历史的经验表明，人类对自然现象的理解往往是曲折前进的。在显微镜发明之前，人类对微生物世界一无所知；在光谱分析出现之前，人类对恒星的化学成分毫无概念。理论的突破往往需要技术的进步来铺垫，也需要时间的沉淀来成熟。人工智能的理论困境，也许只是意味着这个领域还处于它的前伽利略时代——我们已经能够制造出精密的望远镜来观测智能的现象，但尚未建立起描述这些现象运动规律的动力学。

在等待理论黎明的同时，社会需要培养一种对技术的敬畏之心。这种敬畏不是恐惧，不是盲目崇拜，而是一种清醒的承认：我们手中握着的，是一种我们尚未完全理解的强大力量。这种承认应该转化为行动上的审慎——在关键领域部署人工智能时的严格验证，在系统设计中的多重安全冗余，在决策过程中的保持人类监督，在公共政策制定中的广泛参与和透明讨论。

最终，人工智能的理论困境提醒我们一个古老而常新的真理：人类的知识永远是有限的，而未知永远是无限的。我们能够在无知中建造，但我们不应在无知中傲慢。我们能够在黑暗中摸索，但我们应始终记得点燃一盏理论的灯。这盏灯也许现在还微弱，也许还摇曳不定，但它是我们在漫长黑夜中唯一能够信赖的向导。

当未来的史学家回望今天这个时代，他们也许会这样说：那是人类第一次建造出了比自己更复杂的信息处理机器的年代，也是人类第一次被迫直面自己理解能力局限的年代。在那个年代，奇迹与迷雾并存，狂飙与沉思同在。而人类最终能否穿越迷雾，不仅取决于技术的进步，更取决于一种罕见的智慧——在创造的力量面前，保持理解的渴望；在理解的渴望面前，保持谦卑的耐心。

这场远征没有地图，但远征本身，也许就是绘制地图的方式。

转载本文请联系原作者获取授权，同时请注明本文来自王涛科学网博客。
链接地址：https://blog.sciencenet.cn/blog-41701-1536073.html

上一篇：Kimi观点：图灵机能够模拟生命和意识么？如果不可以，那么可以接近到什么程度？
下一篇：Kimi观点：AI学习，为什么缺少深度？

欢迎参加科学网十佳博文评选活动！

主办单位：

支持单位：

收藏 IP: 111.27.171.*| 热度|

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

Kimi观点：为什么说，从历史的角度来说，人工智能不是一个靠谱的技术领域？

当前推荐数：6 推荐人：宁利中 刘进平 杨正瓴 郑永军 蒋大和 高宏

该博文允许注册用户评论请点击登录评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

别人成仙得道，我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

Kimi观点：为什么说，从历史的角度来说，人工智能不是一个靠谱的技术领域？

当前推荐数：6 推荐人： 宁利中 刘进平 杨正瓴 郑永军 蒋大和 高宏

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

王涛

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

当前推荐数：6 推荐人：宁利中刘进平杨正瓴郑永军蒋大和高宏

该博文允许注册用户评论请点击登录评论 (0 个评论)