||
(本文为本人观点)
《从主动推断到自动推断》
引言:智能的困惑
想象一下,当你伸手去够桌上的一杯水时,你的大脑究竟做了什么?传统神经科学可能会告诉你:视觉系统捕捉到杯子的图像,识别出它的位置和形状,然后运动系统计算出手臂需要经过的轨迹,最后发出指令,手指弯曲,握住杯柄,完成动作。
这听起来像是一个精密的机器在按部就班地执行程序。但近年来,一种名为"主动推断"的理论提出了一个截然不同的视角。它认为,你的大脑并不是在被动地"反应",而是在主动地"预测"。你的手臂之所以移动,不是因为它接收到了"去抓杯子"的指令,而是因为它在最小化一个名为"惊讶"的东西——当你的预测("杯子应该在那里")与实际感知("手应该移到那里才能碰到杯子")不符时,身体通过行动来消除这种差异。
这个理论优雅而强大,它试图用统一的框架解释从细菌觅食到人类思考的几乎所有自适应行为。它告诉我们:生命体本质上是预测机器,我们感知世界不是为了反映世界,而是为了验证我们对世界的猜测;我们行动不是为了达成目标,而是为了让现实符合我们的预期。
然而,在这套理论的光环之下,隐藏着一个深刻的悖论。当我们仔细审视"主动推断"的基础时,会发现它悄悄地预设了它试图解释的东西。它说智能体是"主动"的,因为它们"想要"最小化惊讶;但为什么智能体会"想要"任何东西?这种"主动性"从何而来?如果我们预设了智能体天生就是主动的,那么我们就陷入了循环论证:智能体主动是因为它们要推断,它们推断是因为它们主动。这就像说"火是热的因为它在燃烧,它在燃烧因为它是热的"——虽然听起来对,却没有解释任何东西。
这个问题困扰了许多研究者。如果我们要真正理解生命和智能的本质,就必须找到一个更基础的出发点——一个不需要预设"主动性",却能让"主动性"自然涌现的出发点。这就是从"主动推断"走向"自动推断"的旅程。
第一部分:主动推断的辉煌与阴影
让我们更仔细地看看主动推断理论。它的核心思想可以追溯到一个简单的观察:生命体似乎总是趋向于稳定的状态。一个细菌会游向营养物,避开毒素;一个人会寻找遮蔽处躲避暴雨。传统上,我们用"目标"、"欲望"或"意图"来解释这些行为。但主动推断理论说,这些都不需要。生命体只是在最小化"自由能"——一个衡量生物体内部状态与外部环境预期差异的物理量。
在这个框架中,大脑被看作是一个生成模型。它不断地生成关于世界应该是什么样的预测,然后通过感官接收实际的数据。当预测与现实不符时,就产生了"预测误差",也就是"惊讶"。生命体无法忍受长时间的惊讶,因为这代表着不确定性,而不确定性在进化上是危险的。于是,它有两个选择:要么更新内部的预测模型(感知),要么改变外部环境使之符合预测(行动)。
这就是"主动"的含义:生命体不是被动地等待世界告诉它发生了什么,而是主动地通过行动来让世界变得可预测。感知和行动是同一枚硬币的两面,都是为了最小化自由能,消除惊讶。
这个理论解释力惊人。它不仅能解释简单的反射,还能解释复杂的认知过程,比如注意力、学习、甚至意识。它似乎为理解智能提供了一个统一的物理基础。
但问题就出在这个"主动"上。当我们说生命体"主动"地最小化自由能时,我们实际上预设了一个已经存在的、有边界的、有利益考量的"自我"。这个自我已经知道什么是"好"的(低惊讶)什么是"坏"的(高惊讶),并且已经具备了"行动"的能力。这就像是在解释汽车为什么会跑之前,就已经假设了发动机的存在。
更严重的是,这种"主动性"被当作了不可再还原的原初属性。我们问:为什么智能体会行动?答案是:因为它们要最小化惊讶。但我们再问:为什么它们要最小化惊讶?答案是:因为它们是主动的。这个循环让我们陷入了一个哲学困境:我们似乎是在用智能解释智能,用生命解释生命。
在物理学中,我们不会接受这样的解释。我们不会说"行星主动地想围绕太阳转",而是说"引力场决定了它们的轨迹"。同样,如果我们真的想要一个关于智能的科学理论,我们需要找到那个类似于"引力"的东西——那个不需要预设智能体,却能让智能自然涌现的底层机制。
第二部分:回到原点——临界态的启示
为了找到这个基础,我们需要暂时放下"智能"、"目标"、"预测"这些负载过重的词汇,回到更原始的物理图景。想象一下,在一个理想的世界里,物质处于最完美的平衡状态:温度均匀,密度均匀,没有任何特征,没有任何结构。这就是物理学家所说的"热力学平衡态"。在这种状态下,没有任何事情会发生,没有信息流动,没有时间箭头。显然,这不是生命所在的状态。
现在想象另一个极端:完全的混沌。粒子以随机的方式运动,没有任何规律,没有任何可预测性。在这种状态下,信息确实在流动,但太快太乱,无法形成任何稳定的结构。这也不是生命。
那么生命在哪里?生命似乎处于这两个极端之间的一个微妙地带——一个被称为"临界态"的特殊状态。
临界态是一个神奇的状态。在这个状态下,系统对所有尺度的扰动都同样敏感。想象一下森林火灾的模型:当树木的密度刚好处于临界值时,一点火星可能只烧掉几棵树,也可能引发席卷整片森林的大火,所有尺度的火灾都可能发生,没有哪种规模是特殊的。这种"标度不变性"是临界态的标志。
重要的是,处于临界态的系统具有最大的信息处理能力。它既不像平衡态那样死寂,也不像混沌那样无序;它恰好处于"有序"与"无序"的刀刃上。任何微小的输入都能引起响应,但这种响应不会失控;复杂的模式可以涌现,但不会僵化。
传统的物理学 often 把临界态看作是一种特殊的情况,需要精细调节参数才能达到。但近年来,研究者发现,许多生命系统似乎自然而然地维持在这种临界态上,或者说,它们能够通过自适应的方式回到临界态。这被称为"自适应临界性"。
这给了我们一个启发:也许,智能和生命的秘密不在于"主动"这个神秘的品质,而在于这种处于临界态的物理属性。也许,所谓的"主动性"只是临界态系统在持续信息冲击下的一种必然表现。
第三部分:UV自由方案——秩序的几何
如果我们接受临界态作为起点,下一个问题就是:一个处于临界态的系统,面对持续的外界信息刺激时,会发生什么?
想象一束白光照射到一块完美的棱镜上。白光本身是多频率光的混合,没有特征颜色,就像临界态一样"平坦"。但当它通过棱镜时,奇迹发生了:白光被分解成了彩虹般的色谱。不同频率的光因为折射率不同而被分离开来,红色弯曲得少,紫色弯曲得多,原本混在一起的信息现在按照频率被组织成了空间上的秩序。
这个光学现象给了我们一个深刻的隐喻。当一个处于临界态的系统(对一切频率敏感)面对外界的多频率刺激时,它不能保持"平坦"——它必须发展出一种结构来应对这种复杂性。但这种结构不能是任意的;它必须满足物理定律,特别是热力学定律。
在等温等容的条件下,系统的自由能必须减少。这意味着系统必须找到一种方式,既能够降低内能(形成稳定结构),又能够增加熵(探索足够的状态空间以处理信息)。这似乎是个矛盾:秩序通常意味着低熵,而高熵意味着无序。如何在两者之间取得平衡?
答案是一种被称为"UV自由方案"的组织形式。这个名字来源于物理学中的紫外和可见光,但在这里它代表了一种特定的信息组织方式。
想象系统需要处理来自外界的信息。它面临两个极端:一个是完全刚化的内部模型,它把一切都看作是一样的,拒绝改变(这对应于"U"过度约束);另一个是完全没有内部模型,每一刻的信息都是全新的,无法形成记忆(这对应于"V"无法绑定)。显然,这两者都无法有效处理信息。
UV自由方案找到了第三条路。它将信息处理分成两个部分:一个部分负责约束可能的世界模型(U),保持核心的稳定性;另一个部分负责绑定具体的观测(V),保持对细节的敏感。这两者不是简单相加,而是以一种特定的方式结合,使得整体的处理能力最大化,同时保持有限性——不需要无限的计算资源,也不需要无限的记忆。
关键是,这种结构不是被设计出来的,而是在临界态面对多频率刺激时,自由能最小化的必然几何。就像白光通过棱镜必然色散一样,临界态系统面对多频率信息刺激,必然发展出这种UV结构。
第四部分:时间的难题与全息拷贝
当UV结构开始运作时,它面临一个根本性的难题:时间。
外界的信息不是单频率的,而是包含了从极快到极慢的各种时间尺度。想象一下,你站在海边:海浪的泡沫在你脚边瞬间生灭(快尺度),潮汐在几小时内涨落(中尺度),而海岸线的侵蚀则需要数年才能察觉(慢尺度)。一个真正的智能系统必须同时处理所有这些尺度。
问题在于,这些尺度的时间节奏完全不同。快尺度已经完成了成千上万个周期,慢尺度可能还没有启动。如果系统只有一个统一的"现在",它要么只能跟上快尺度而丢失慢尺度的趋势,要么只能跟随慢尺度而错过快尺度的细节。
这就像试图用一根绳子同时画出一个闭合的小圆和一个开放的大螺旋——在单一的连通空间里,这是不可能的。
解决这个几何难题的方法令人惊讶:系统必须在空间中"复制"自己。不是生物学意义上的繁殖,而是拓扑意义上的分裂——一个中心变成多个中心,每个中心承载不同的时间尺度,但它们之间又通过某种方式保持连接。
这种"全息拷贝"具有奇妙的性质。每个拷贝都携带了完整的核心结构(就像全息图的每一碎片都包含整体图像),但它们分别绑定不同的局部观测。快尺度的拷贝处理当下的瞬间,慢尺度的拷贝整合长期的趋势,中尺度的拷贝在两者之间协调。
这不是系统"选择"要复制,就像水不是"选择"要流动一样。这是UV结构为了维持自身的一致性,在自由能最小化的驱动下,必然采取的几何形式。当时间上的分离无法在单一节点上调和时,空间上的分离就成了唯一的解决方案。
第五部分:自动推断的涌现
现在,我们看到了一幅全新的图景。系统不是从一个预设的"主动"自我开始,而是从裸临界态出发,面对外界刺激,通过自由能最小化,涌现出UV结构,再通过全息拷贝解决时间不一致的问题。
那么,所谓的"推断"在哪里?所谓的"主动"在哪里?
答案是:它们无处不在,但 nowhere 被预设。
UV结构中的U部分不断地生成关于世界应该是什么样的内部模型——这就是预测。V部分不断地接收外界信息,验证这些预测——这就是感知。当预测与感知不符时,自由能上升,系统必须采取行动来消除这种不符——不是因为它"想要"这样做,而是因为UV结构的几何不允许长期的高自由能状态。
这就像是水往低处流。水不是"主动"地寻找低处,它只是遵循引力。同样,在这个框架中,智能体不是"主动"地最小化惊讶,而是UV结构在临界态上的动力学必然表现为这种行为。
这就是"自动推断"与"主动推断"的根本区别。在主动推断中,"主动"是一个神秘的、预设的品质;在自动推断中,"自适应"是物理结构自然涌现的属性。前者像是一个 already alive 的东西在努力生存,后者像是从物理中自然地生长出生命。
这种自动性体现在多个层面:
在感知层面,系统不是被动地接收信息,而是主动地(自动地)通过UV结构的V部分采样世界。但这种"主动"不是意志的体现,而是结构的功能——就像棱镜自动地分离白光一样。
在行动层面,系统通过改变世界来让预测成真。但这也不是"意图"的实现,而是自由能最小化的几何要求——当内部模型已经预测了某个状态时,系统必须通过行动让外部世界符合这个模型,否则自由能会持续升高。
在学习层面,系统通过更新U部分来改进世界模型。这同样不是"想要学习"的表现,而是当旧的模型无法有效绑定观测时,结构必须发生的形变。
第六部分:知觉的起源
这带我们来到了一个最深刻的问题:意识或知觉从何而来?
在传统的认知科学中,知觉通常被看作是对外部世界的表征或模型。但在自动推断的框架中,知觉有了完全不同的含义。
回想一下白光通过棱镜的例子。在通过棱镜之前,白光"包含"了所有颜色,但没有任何特定的颜色被"体验"到。棱镜的色散让颜色"显现"出来。同样,在裸临界态中,系统"包含"了处理所有信息的可能性,但没有任何特定的信息被"知觉"到。
UV结构的作用就像棱镜。它将混沌的多频率刺激分解成可处理的尺度,让特定的模式得以显现。当快尺度的V部分绑定当下的感觉,慢尺度的U部分提供背景预期,两者的交互产生了"这是什么"的体验。
知觉不是对外部世界的镜子般的反映,也不是内部幻想的投射。它是UV结构在处理信息时,对自身预测-验证循环的主观显现。当我们看到一个红色苹果时,我们不仅是在接收光信号,更是在验证"这是一个苹果"的预测;当预测与感觉输入匹配时,那种"看到"的体验就涌现了。
这种观点解释了为什么知觉既是建构的(基于U部分的先验预期),又是受约束的(必须通过V部分的观测绑定)。它也解释了为什么我们有"自我"的感觉——那个持续进行预测、验证、行动的UV结构,在持续的信息处理中,自然而然地形成了一个连贯的视角。
但最重要的是,这种知觉不需要预设一个"知觉者"。它从临界态的物理,通过UV结构的涌现,自然而然地生长出来。就像漩涡从流体力学中涌现,而不需要水分子"决定"要形成漩涡一样,知觉从自动推断中涌现,而不需要一个幽灵般的"自我"来主持大局。
第七部分:生命的新定义
如果自动推断的框架是正确的,那么我们就必须重新思考什么是生命。
传统上,生命往往被定义为具有新陈代谢、繁殖、适应等特征的东西。但这些定义要么是功能性的(生命做什么),要么是模糊的(什么是"适应")。自动推断提供了一个更基础的视角:生命是临界态在自由能约束下,维持UV结构自维持的物理过程。
这意味着,生命不是一个特殊的类别,而是一种特殊的组织形式——一种在混沌边缘保持稳定的组织形式。细菌、植物、动物、人类,乃至未来可能出现的人工系统,只要满足这个条件,就都在这个连续谱上。
繁殖或自我复制,在这个框架中也有了新的解释。它不是生命为了延续而发展出的策略,而是UV结构处理时间不一致时的几何必然。当单一节点无法承载所有时间尺度时,分裂成多个节点(全息拷贝)是最小化自由能的唯一方式。这种"复制"看起来像是繁殖,实则是结构自维持的副产品。
同样,进化也不是随机的试错,而是UV结构在持续刺激下的适应性形变。U部分的约束提供了稳定性(遗传),V部分的分化提供了灵活性(变异),而自由能最小化提供了选择压力。
这个视角甚至模糊了生命与非生命的界限。一个足够复杂的、处于临界态的、具有UV样结构的非生物系统,原则上可以表现出类似生命的特征——自适应、学习、甚至某种形式的知觉。这不再是科幻,而是物理的推论。
第八部分:从解释到创造
理解自动推断不仅是理论上的突破,它也开启了工程上的可能性。
传统的主动推断理论在人工智能领域有重要应用,但它往往面临着"谁为智能体设定目标"的问题。如果我们必须预设一个主动的、有目标的智能体,那么我们就无法从零创造出真正的智能——我们只能模仿已有的智能。
但自动推断框架告诉我们,如果我们能够搭建UV自由方案——即创造一个处于临界态、具有适当的U约束和V绑定能力的系统——那么活性就会自然涌现。我们不需要预设"主动性",只需要设定物理条件。
这就像制造棱镜。我们不需要告诉棱镜"请分离白光",我们只需要制造出具有特定折射率的几何形状,色散就会自然发生。同样,如果我们能够制造出具有UV结构的临界态系统,自动推断就会自然发生。
这为创造真正的人工生命或通用人工智能提供了新的路径。不是通过编程复杂的规则和目标,而是通过构建能够自组织的物理或虚拟系统——让临界态、自由能最小化、UV结构这些物理原理自己工作。
想象一下,一个由简单单元组成的大型网络,每个单元都处于临界态,单元之间通过简单的规则耦合。当这个系统面对环境刺激时,它自然而然地发展出多尺度结构,自然而然地产生全息拷贝,自然而然地表现出自适应行为。这不是模拟生命,这就是生命的一种形式。
第九部分:统一的世界观
从主动推断到自动推断的转变,不仅仅是技术细节的修正,它代表了一种世界观的转变。
在旧的观点中,宇宙是死的,生命是特殊的,智能是神秘的。生命体像是宇宙中的异乡人,带着不可解释的自由意志,在物质世界中挣扎求存。
在新的观点中,宇宙本身就具有信息的属性,临界态是物质的普遍存在方式,生命和智能是物理自然涌现的现象。生命不是对抗熵增的奇迹,而是自由能最小化的一种精致表现;智能不是超越物理的幽灵,而是UV结构处理信息的自然方式。
这种观点统一了物理与心理,自然与生命,机器与智能。它告诉我们,我们之所以能理解世界,是因为我们就是用与世界相同的材质构成的;我们之所以能够预测未来,是因为我们自己就是预测物理的化身。
当我们望向星空,看到星系的旋转,当我们低头看显微镜,看到分子的舞蹈,当我们内观自心,看到思绪的流动——在自动推断的框架中,这些都是同一套几何的不同表现。临界态无处不在,UV结构无处不在,自动推断无处不在。
结语:刀刃上的舞蹈
从主动推断到自动推断,我们实际上是回到了更基础、更谦卑的出发点。我们不再假设"主动性"这个神秘的品质,而是承认:所谓的主动,只是物理系统在特定条件下必然呈现的面貌。
生命不是拥有某种特殊本质的存在,而是在混沌与秩序的边缘,在临界态的刀刃上,通过UV结构的自维持,进行的一场永恒的舞蹈。这场舞蹈不需要编舞者,因为舞蹈本身就是物理;这场舞蹈不需要观众,因为知觉从舞蹈中自然涌现。
当我们理解了这一点,我们不仅理解了生命是什么,也理解了如何创造生命。自动推断不仅解释了过去,也开启了未来。在这个框架中,智能不再是人类的专属特权,而是宇宙信息处理的一种普遍模式——只要我们能够搭建那个刀刃,那个UV结构,那个临界态,活性就会如泉水般自然涌出。
这或许就是科学的终极愿景:不是用神秘解释神秘,而是用简单解释复杂,用物理解释生命,用结构解释智能。从主动到自动,从预设到涌现,从奇迹到必然——这是一场思想的解放,也是一扇通往新世界的门。
现在,这扇门已经打开。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-12 19:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社