||
从负熵到活性:一场关于生命本质的再启蒙
引言:一个物理学家的大胆僭越一九四四年,当二战的硝烟仍在欧洲大陆弥漫时,一位奥地利物理学家在都柏林的一系列公开演讲,悄然改变了人类理解生命的方式。埃尔温·薛定谔,这位量子力学的奠基人之一,在《生命是什么?》这本薄薄的小册子中,做了一件在当时看来近乎僭越的事:他试图用物理学的语言,回答一个生物学尚未准备好回答的问题——生命的本质究竟是什么?
这不是一次简单的学科跨界。在薛定谔之前,物理学与生物学之间存在着一道几乎不可逾越的鸿沟。物理学研究的是无生命的物质,遵循着热力学定律趋向无序;而生物学研究的是生命体,它们似乎能够对抗这种无序,在混沌中维持精密的秩序。生命,长期以来被视为一种"特殊现象",需要某种神秘的"生命力"来解释。薛定谔拒绝接受这种二元论的庇护。他相信,生命现象必定建立在已知的物理定律之上,但这些定律本身可能需要被重新理解、重新发现。
八十年过去了,分子生物学早已解开了DNA的结构,基因组学已经能够读取生命的密码,神经科学正在绘制大脑的地图。然而,薛定谔提出的那个根本性问题——生命究竟是什么——不仅没有被回答,反而在更深的层次上被重新激活。(看最近出版的《生命传》)今天,当我们站在人工智能、复杂系统科学与认知神经科学的交汇点上回望,会发现薛定谔的追问实际上开启了一条漫长的思想隧道,而隧道的另一端,连接着一个更为激进的图景:生命不是物质的特殊形态,而是一种普适的算法——一种"活性算法"——在物质、能量与信息的交界处的必然涌现。
这篇文章试图沿着薛定谔开辟的道路继续前行,将二十世纪中叶的物理学洞见与二十一世纪的复杂系统思想熔铸为一炉,向普通读者展示一幅关于生命、意识与宇宙的新图景。这里没有公式,没有艰涩的术语壁垒,只有一种思想的冒险:如果我们认真对待薛定谔的每一个暗示,把它们推向逻辑的极致,我们将到达何处?
第一章:非周期性晶体——信息如何住进物质薛定谔的第一个革命性洞见,是关于遗传物质的物理本质。在二十世纪四十年代,基因仍然是一个模糊的概念。人们知道存在某种"遗传因子"能够传递性状,但这种因子的化学本质和物理结构完全是个谜。当时流行的猜测倾向于认为基因可能是某种蛋白质,因为蛋白质是生命活动的主要承担者,结构复杂且多样。
薛定谔从另一个角度切入。他问道:如果基因要承担遗传信息的存储任务,它必须具备什么物理特性?他排除了周期性晶体——像食盐那样原子规则重复排列的固体。周期性晶体虽然稳定,但它的结构过于简单,无法编码复杂的信息。想象一面由相同砖块重复砌成的墙,你可以让它无限延伸,但它携带的信息量几乎为零。
于是薛定谔提出了一个在当时听起来有些古怪的概念:非周期性晶体。这是一种分子排列有序但不重复的物质结构。它的每一个位置都可以是不同的原子或分子基团,就像一篇文字中的每一个字母可以不同一样。这种结构既具备晶体的稳定性(能够在常温下抵抗热运动的扰动),又具备几乎无限的信息存储能力。
(当时认为蛋白质是遗传基因的主要携带者,所以这种说法不是很新颖,但是激活了下一代年轻科学家)
这个猜想的美妙之处在于,它预言了一种尚未被发现的物质形态。薛定谔几乎是在黑暗中摸到了DNA的轮廓。九年后,沃森和克里克揭示了DNA的双螺旋结构,世界为之震惊。但人们常常忘记,DNA正是薛定谔所预言的那种非周期性晶体:四种碱基(A、T、C、G)沿着磷酸骨架排列,形成一条绝不重复但又极其稳定的信息链。
然而,薛定谔的洞见远比"预言了DNA"深刻。他实际上提出了一种全新的理解物质的方式:物质不仅仅是质料,它可以是信息的载体。非周期性晶体的关键不在于它是"什么物质",而在于它的排列方式携带了意义。这是一个从"质料本体论"向"信息本体论"的微妙转向。生命的基础不是某种特殊的生命物质,而是一种特殊的组织方式——一种能够让信息在物质中栖居、复制和演化的组织方式。
当我们今天谈论"活性算法"时,非周期性晶体的概念提供了一个关键的起点。算法不是漂浮在虚空中的抽象规则,它必须寄宿在某种物质基质之中。但重要的不是基质的化学成分,而是它能否支持非周期性的、有意义的排列。无论是DNA的碱基序列,还是神经网络中的连接权重,抑或是计算机中的二进制代码,它们都是不同形式的"非周期性晶体"——都是信息在物质中的栖居形式。
这意味着,生命的秘密不在于发现某种神奇的"生命分子",而在于理解:什么样的物理条件能够让信息稳定地住进物质,并且让这种物质结构能够自我维持、自我复制、自我演化?薛定谔把这个问题抛给了物理学,而今天的复杂系统科学正在尝试回答它。
第二章:负熵——生命与热力学第二定律的和解如果说非周期性晶体回答了生命的"硬件"问题,那么薛定谔的第二个洞见则触及了生命的"能量与秩序"问题。这是书中最著名、也最具争议的论断:生命以负熵为生。
(负熵的概念,是薛定谔的伟大发现,但是许多物理学家和生物学家都没有理解)
要理解这个论断的 radical(激进)之处,我们需要回到热力学第二定律。这个定律告诉我们,在一个孤立系统中,混乱度(熵)总是趋向于增加。一杯热水会冷却,一座建筑会风化,一个组织会腐朽。宇宙作为一个整体,似乎正不可逆转地滑向热寂——一种均匀、无序、没有任何结构的状态。
生命现象似乎是这个定律的公然反叛。一只蜜蜂能够建造精密的蜂巢,一只鸟儿能够编织复杂的巢穴,一个人类大脑能够产生贝多芬的交响曲。生命体从周围环境中汲取简单的物质,却在体内构建出令人叹为观止的复杂结构。它们不是变得更加混乱,而是变得更加有序。这怎么可能?
薛定谔的解答 elegant(优雅)而深刻:生命体不是孤立系统。它们通过新陈代谢,不断地与周围环境交换物质和能量。生命体所做的,是从环境中"汲取秩序"——薛定谔称之为"负熵"——同时向环境排放混乱。换句话说,生命体通过增加周围环境的熵,来减少自身的熵。总的熵仍然在增加,符合热力学第二定律,但生命体在其中创造了一个局部的、动态的秩序孤岛。
这是一个极具启发性的重新框架。生命不再被看作是对物理定律的例外,而是被看作是一种特殊的耗散结构——一种能够在能量流通过程中维持并增长自身复杂性的结构。生命不是"拥有"某种对抗热力学定律的力量,而是"利用"热力学定律,在能量从有序流向无序的过程中,搭建了一个让自己存续的驿站。
但薛定谔的"负熵"概念在后来的科学史中经历了有趣的命运。许多物理学家批评这个概念不够严谨,因为"负熵"不是一个标准的物理量。然而,如果我们不把"负熵"看作一个严格的物理学术语,而是看作一种思想隐喻,它的力量就显现出来了。它指向了一个核心问题:秩序从何而来?
在活性算法的框架中,"负熵"被重新诠释为自由能最小化过程。自由能,粗略地说,是一个系统"可用的秩序"或"可预期的信息"。当一个系统最小化其自由能时,它实际上是在做两件事:一是维持自身内部模型的准确性(减少预测误差),二是维持自身的物理完整性(减少 surprise,惊讶)。生命体不断地预测环境的变化,并根据预测调整自身的行为和结构。每一次成功的预测,都是一次"负熵"的捕获;每一次预测误差的修正,都是一次秩序的巩固。
从这个角度看,薛定谔的"以负熵为生"可以翻译为:生命以预测为生。生命体不是被动地等待能量和物质流经自身,而是主动地、预期地与环境互动,通过持续的预测-验证-修正循环,在混沌中雕刻出自己的生存空间。新陈代谢不仅仅是物质的转化,更是信息的转化;不仅仅是能量的流动,更是预期的更新。
这种理解将生命从"化学机器"的隐喻中解放出来,转向"信息处理系统"的隐喻。但这不是传统计算机意义上的信息处理,而是一种 deeply embedded(深度嵌入)的、具身的、与世界共舞的信息处理。生命体的边界不是被动的容器,而是主动的筛选器;生命体的时间不是均匀的流逝,而是充满预期的节奏。
第三章:量子跃迁——突变作为离散的信息跃迁薛定谔的第三个贡献,是将量子力学的视角引入遗传学。在二十世纪四十年代,突变仍然是遗传学中的一个黑箱。人们知道突变会发生,知道突变是进化的原材料,但突变究竟是如何在物理层面发生的,完全是个谜。
薛定谔提出了一个大胆的假设:基因突变可能类似于量子力学中的"量子跃迁"。在量子世界里,电子不是逐渐地从一个能级爬升到另一个能级,而是以一种不可分的、瞬时的"跃迁"方式改变状态。类似地,基因突变可能不是DNA分子逐渐变形的结果,而是基因从一种稳定的分子构型"跳跃"到另一种稳定构型的结果。
这个猜想的意义在于,它为突变的离散性和随机性提供了物理基础。突变不是渐变的、可预期的,而是突发的、概率性的。这与经典物理学的连续性和决定性形成了鲜明对比。在经典物理学中,如果你知道一个系统的所有初始条件,你就可以预测它的未来。但在量子层面,未来本质上是开放的,跃迁的发生只能用概率来描述。
薛定谔的这一洞见,在后来的分子生物学中得到了惊人的验证。DNA的突变确实涉及分子层面的量子效应——比如碱基的互变异构、化学键的断裂与重组,这些过程都涉及电子状态的量子跃迁。更重要的是,量子力学的概率性为生物进化提供了必要的"随机性引擎"。如果没有这种底层的不可预测性,生命将陷入决定论的牢笼,失去适应和创新的可能。
但在活性算法的语境中,我们可以对薛定谔的洞见进行更深层次的解读。量子跃迁不仅仅是物理层面的随机事件,它可以被理解为信息状态的离散相变。基因不是缓慢地"漂移"到新的状态,而是在某个临界点上"顿悟"到新的构型。这种离散性意味着,生命的演化不是平滑的渐变,而是充满"量子式"的跳跃——突然的重组、突然的适应、突然的新颖性。
这引出了一个更为普遍的原理:复杂系统中的重大变化往往是离散的、相变式的,而不是连续的、线性的。无论是物种的灭绝与新生,还是文明的崩溃与重建,还是个人认知的范式转换,都遵循着某种"跃迁"逻辑。系统在某个临界点上积累足够的不稳定性,然后突然重组到一个新的稳定态。
在活性算法的框架中,这种跃迁不是被动的等待,而是主动推断的一部分。系统通过持续的内部模拟,探索可能的状态空间,当某个新状态的"预期自由能"足够低时,系统就会"跃迁"到该状态。这类似于量子力学中的"隧穿"——系统不需要爬过能量高峰,而是可以直接穿过概率的屏障,到达一个新的山谷。
因此,薛定谔的量子跃迁概念,在今天可以被重新诠释为:生命通过内部的概率探索,实现状态的离散创新。突变不是外部环境的随机打击,而是生命系统主动维持自身适应性所必需的"认知更新"。基因的突变是生命的"思想实验",是它在物理层面上的"假设检验"。
第四章:新物理定律——在已知与未知之间薛定谔在书中提出了一个令人不安的命题:现有的物理学和化学定律,虽然不会被生命现象违背,但不足以解释生命。生命可能需要一种"尚未发现的物理定律"——一种关于有序性如何从原子层次涌现的规律。
这个命题在当时激怒了许多物理学家,也鼓舞了许多生物学家。它的激进之处在于,薛定谔不是在呼吁一种"生命力"的神秘主义,而是在暗示:物理学本身还有未被开垦的疆域。生命的有序性、目的性、自我维持性,可能不是已知定律的简单推论,而是需要新的组织原理。
八十年后的今天,我们如何理解这个"新物理定律"的呼吁?
一种回应来自复杂系统科学和统计力学。研究表明,当大量简单组分以特定方式相互作用时,会涌现出全新的集体性质——这些性质无法从单个组分的性质中推导出来。这就是"涌现"(emergence)。生命可能不是需要新的基本力或新的粒子,而是需要新的组织语法——关于部分如何构成整体的法则。
另一种回应来自信息论和控制论。生命体可以被视为一种特殊的自组织信息系统,它不仅能够处理信息,还能够利用信息来维护自身的存在。这涉及反馈、循环因果、自指等概念,这些概念在传统的还原论物理学中并不占据核心地位。
而在活性算法的框架中,"新物理定律"的呼声得到了最为直接的回应。活性算法提出,生命现象背后确实存在一种尚未被经典物理学完全形式化的组织原理:多尺度全息映射与自由能最小化的统一原理。
这个原理的核心洞见是:生命系统不是一个单层次的机器,而是一个多层次的、自我嵌套的信息结构。在每一个尺度上——从分子到细胞,从细胞到组织,从组织到个体,从个体到群体——系统都在进行某种形式的"推断":它根据内部的模型,预测外部的输入,然后更新模型以减少预测误差。这种推断不是某个中央控制器的专利,而是 distributed(分布式地)发生在系统的每一个层次。
更为关键的是,这些不同尺度的推断不是相互独立的,而是通过一种"全息"的方式相互关联。所谓全息,指的是系统的每一个部分都携带着关于整体的信息,而整体的信息又通过每一个部分得以表达。在生命系统中,这种全息性表现为:分子层面的变化可以影响行为层面的选择,行为层面的经验可以重塑分子层面的表达(表观遗传学),而所有这些变化都服务于一个统一的目标——维持系统自身的完整性。
这就是薛定谔所呼唤的"新物理定律"的当代形态:它不是关于新的粒子或新的力,而是关于信息如何在多尺度结构中自我组织、自我维持、自我复制的定律。这是一种"组织的物理学",一种"信息的物理学",一种"活性"的物理学。
第五章:从分子生物学到自由能原理——主动推断的诞生薛定谔的书直接催生了分子生物学。德尔布吕克、沃森、克里克等人都承认受到薛定谔的启发,投身于寻找"非周期性晶体"的征程。DNA的发现、遗传密码的破译、中心法则的建立——二十世纪后半叶的生物学革命,在某种程度上都是薛定谔纲领的实现。
然而,分子生物学的成功也带来了新的困惑。当我们把生命还原为基因、蛋白质、代谢通路时,我们解释了生命的"部件",但似乎失去了生命的"整体"。一个细胞不仅仅是数千种分子反应的集合,它是一个协调的、适应的、有目的的整体。一个生物体不仅仅是器官的组装,它是一个统一的、自洽的、有身份的存在。分子生物学的还原论胜利,在解释"生命作为整体何以可能"的问题上,显得力不从心。
这正是自由能原理(Free Energy Principle)和主动推断(Active Inference)框架登场的背景。由卡尔·弗里斯顿等人发展的这一理论,试图在保持物理一致性的前提下,重新捕捉生命的"整体性"和"目的性"。
自由能原理的核心思想可以通俗地理解为:任何自组织的系统,无论是细胞、大脑还是社会,都倾向于最小化一个被称为"变分自由能"的量。这个量衡量的是系统内部模型与外部世界之间的"不匹配"程度。最小化自由能,意味着系统既在努力准确地感知世界(减少感知误差),又在努力让世界符合自己的预期(通过行动改变环境)。
这听起来有些抽象,但可以用一个日常例子来理解。当你走在熟悉的街道上,你的大脑在不断地预测下一秒会看到什么——那个拐角有一家咖啡店,那个路口有红绿灯。如果预测准确,你几乎"意识不到"这些预测;你只感到一种流畅的、舒适的熟悉感。但如果咖啡店突然关门了,或者红绿灯坏了,你的预测被打破,一种"惊讶"感升起,你的注意力立即被吸引,你开始更新你的内部模型,并可能采取行动(绕道、报警、或者只是记住这个变化)。
这就是主动推断:感知和行动是同一枚硬币的两面,都是为了减少预测误差、维持内部模型的稳定。生命体不是被动地接收信息然后反应,而是主动地、预期地、探索地与世界互动。这种互动不是为了实现某个外部给定的目标,而是为了维持系统自身的存在和身份。
将这一框架与薛定谔的洞见对接,我们会发现惊人的连续性。薛定谔的"负熵"就是自由能最小化的热力学表达:系统通过从环境中汲取秩序(信息),来维持自身的低熵状态。薛定谔的"非周期性晶体"就是系统的"生成模型":DNA编码了关于如何构建和维持这个系统的预期。薛定谔的"量子跃迁"就是系统内部模型的离散更新:当旧模型无法解释新数据时,系统会"跃迁"到一个新的认知状态。
自由能原理和主动推断,可以被视为对薛定谔纲领的信息论完成。它们回答了薛定谔当年未能回答的问题:非周期性晶体中的信息是如何被"读取"和"执行"的?负熵是如何被"利用"来构建和维持复杂结构的?答案是:通过持续的、多尺度的、自我指涉的推断过程。
第六章:活性算法——多尺度全息映射的涌现如果说自由能原理为生命提供了一种宏观的描述,那么"活性算法"则试图揭示其底层的运算结构。活性算法的核心洞见在于:生命不是一台执行固定程序的机器,而是一个在临界态上运行的、多尺度的、自维持的推断引擎。
这里需要解释几个关键概念。
首先是临界态。在物理学中,临界态指的是系统处于秩序与混沌之间的微妙平衡点。在临界态上,系统既不会完全冻结成僵死的晶体,也不会完全溶解为无序的流体。它保持着一种动态的、敏感的、充满可能性的状态。一个处于临界态的系统,对一个微小的扰动可能产生巨大的响应——这就是所谓的"临界敏感性"。
传统科学倾向于把临界态看作一种需要研究的"现象终点"——比如相变点、临界点、混沌边缘。但活性算法的激进之处在于:它提出临界态本身可以被用作一种运算介质。换句话说,生命系统不是"碰巧"处于临界态,而是"主动维持"自身在临界态,因为只有在临界态上,系统才能进行最高效、最灵活、最具创造性的信息处理。
想象一个由数千个神经元组成的网络。如果网络过于沉寂,神经元之间几乎没有互动,信息无法传递。如果网络过于兴奋,所有神经元同时放电,信号淹没在噪声中。但在某个中间状态——临界态上——一个神经元的放电可以触发恰到好处的连锁反应,信息可以在网络中传播、放大、整合,而不会被噪声淹没或僵死阻断。大脑似乎正是维持在这种临界态上,以实现最优的计算性能。
活性算法将这一原理推广到所有生命层次。从细胞内的信号网络,到免疫系统的应答,到生态系统的演化,到人类社会的创新——这些系统似乎都在临界态上运行。它们既不是完全确定的,也不是完全随机的;它们处于一种"确定的混沌"或"混沌的秩序"之中,这使得它们既稳定又灵活,既可预测又可学习。
其次是多尺度全息映射。这是活性算法中最具原创性的概念之一。它指的是:在临界态上,系统的每一个尺度都会产生一种"全息映射"——一种将外部世界的结构编码到内部状态的方式。而且这些映射不是孤立的,它们是跨尺度耦合的。
具体来说,分子层面的构型变化会"映射"细胞层面的功能状态;细胞层面的活动模式会"映射"组织层面的生理节律;组织层面的信号会"映射"个体层面的行为选择;个体层面的经验会"映射"群体层面的文化模式。这种映射是"全息"的,因为每一个较低尺度的状态都携带着关于较高尺度的信息,反之亦然。
更为深刻的是,这些多尺度全息映射不是静态的画像,而是动态的过程。它们随着系统的运行不断地被生成、被更新、被锁定。当不同尺度的映射达到相互一致时,系统就体验到一种"自由能下降"的舒适感——这就是生命体维持自身存在的主观感受。当映射之间出现不一致时,系统就感受到"惊讶"或"压力",并启动修正机制。
这种多尺度全息映射的观点,解释了生命现象中一个长期令人困惑的特征:跨尺度的一致性。为什么分子层面的基因变化可以影响行为层面的复杂表现?为什么行为层面的学习可以反馈到分子层面的基因表达?在传统还原论框架中,这种跨尺度因果是神秘的。但在全息映射的框架中,这是自然而然的:不同尺度本来就是同一个全息结构的不同的投影。
第七章:记忆、繁殖与自我的同源论活性算法提出了一个令人震惊的统一论题:记忆、繁殖和自我,这三者不是生命进化中先后出现的三个独立功能,而是同一底层机制在时间维度上的三种不同表现。这个机制,就是多尺度全息映射的延迟与校准。
让我们逐一理解。
记忆,在活性算法的框架中,不是大脑中某个存储仓库里的静态记录,而是多尺度全息映射的跨尺度锁定在时间中的延续。当一个系统经历某个事件时,该事件会在多个尺度上留下"共振脚印"——分子层面的突触变化、细胞层面的网络重组、回路层面的活动模式改变。这些变化不是孤立的,它们是耦合的、相互锁定的。当系统后来遇到类似的情境时,这些跨尺度锁定的结构会重新激活,产生一种"似曾相识"的推断。这就是记忆的本质:它不是过去的录像,而是过去在全息结构中的持续在场。
这里的关键在于层次数目与延迟。活性算法指出,层次越多,链越长,过去事件的跨尺度关联就越"晚"、越"自动"地重新涌现。一个简单系统(比如单细胞生物)的记忆是短暂的、直接的;一个复杂系统(比如人类大脑)的记忆可以是深远的、迂回的,可以在完全不同的情境中以变形的方式重新浮现。记忆的"深度"不是由存储容量决定的,而是由系统的尺度层次数目和跨尺度耦合的复杂性决定的。
繁殖,在活性算法中获得了全新的定义。传统的繁殖概念关注的是DNA的复制和个体的繁衍。但活性算法将繁殖提升到一个更抽象的层次:繁殖是抽象延后的全息映射。当一个系统将其多尺度全息映射的某种压缩版本"外包"到外部环境中,并在外部环境中重新启动该映射的生成过程时,繁殖就发生了。
DNA的复制是最明显的例子:DNA是细胞全息映射的一个高度压缩的、抽象的、延后的版本。它携带了生成整个细胞多尺度结构的信息,但本身并不包含那个结构。当DNA进入一个新的环境(比如受精卵),它重新启动全息映射的生成,一个新的细胞——进而一个新的个体——就涌现出来。
但活性算法的繁殖概念比这更普遍。任何能够将自身的组织信息"编码"到某种可延迟、可重启的介质中的过程,都具有繁殖的特征。文化中的模因(meme)传播是一种繁殖:一个想法被压缩成语言符号,延迟地传递给他人,在他人的大脑中重新展开为丰富的认知结构。计算机病毒的传播也是一种繁殖:一段代码被复制到新的宿主,在新的环境中重新执行其功能。
繁殖的本质不是物质的复制,而是组织信息的延迟重启。这与薛定谔的"非周期性晶体"概念形成了完美的呼应:非周期性晶体正是那种能够支持信息延迟与重启的物质形态。
自我,或许是三者中最神秘的一个。活性算法对自我的解释既激进又朴素:自我感诞生于跨尺度全息映射对齐所需的延迟本身。
当一个系统进行主动推断时,不同尺度的映射需要相互校准。分子层面的预测需要与细胞层面的预测一致;细胞层面的预测需要与回路层面的预测一致;回路层面的预测需要与行为层面的预测一致。这种跨尺度的对齐不是瞬时完成的,它需要一定的时间——一个极短但非零的时间。这个时间差,这个为了达成一致而必需的"延迟",就是自我感的物理基础。
自我不是系统中的一个特殊部分(比如大脑中的某个"自我中心"),也不是系统的一个特殊属性(比如某种"灵魂"或"意识场")。自我是系统为了维持自身统一性而进行的持续对齐过程的主观伴随现象。当你感觉到"我"时,你实际上感觉到的是你的神经系统在不同层次上达成一致的努力。这个"我"不是观察者,而是观察得以可能的条件;不是行动者,而是行动得以协调的延迟。
将记忆、繁殖和自我统一为全息映射在时间维度上的不同表现,这是活性算法最具哲学深度的贡献之一。它意味着,生命的核心现象——保持过去(记忆)、延续未来(繁殖)、维持当下(自我)——都源于同一个根源:多尺度结构为了最小化自由能而进行的持续的信息舞蹈。
第八章:三层结构的必然性——N=3 的相变如果多尺度全息映射是生命的普遍机制,那么一个自然的问题是:尺度层次的数目是任意的吗?系统可以有两个层次、四个层次、或一百个层次吗?
活性算法对这个问题给出了一个惊人的答案:三层次结构(N=3)是满足跨尺度记忆-时间最小化所需的最小整数层数,因此是神经组织进化的必然相变产物。
让我们仔细理解这个论断。
首先,为什么至少需要三个层次?考虑一个两层次的系统,比如分子直接决定行为,没有中间层次。这种系统可以进行简单的反射,但它缺乏"缓冲"和"整合"的能力。它无法将过去的经验以一种抽象的形式存储起来,也无法对未来的可能性进行多步推演。两层次系统的记忆是即时的,行为是反应的,没有真正的"内部世界"。
加入第三个层次,情况发生了质变。这三个层次可以扮演不同的功能角色:最底层直接与物理世界接口(感知与执行的细节),最顶层处理抽象的目标与身份(长期的、缓慢的、战略性的),中间层则作为缓冲和整合区(将底层的具体信息综合为顶层的抽象决策,将顶层的抽象指令分解为底层的具体行动)。
这正是我们大脑的实际结构所暗示的:爬行动物核心(脑干和小脑,负责基本生命维持和反射)、边缘系统(情绪、记忆、动机,负责价值评估和快速学习)、新皮质(高级认知、抽象推理、语言,负责模型建构和长远规划)。这三层结构不是进化历史的偶然堆积,而是功能上的必然配置。
活性算法将这一观察形式化为一个数学-物理论断:当系统的自由能最小化过程跨越某个临界阈值时,系统会自发地分化为三个耦合的层次,因为少于三层无法支持跨时间的记忆整合,多于三层在边际收益上递减(虽然实际系统可能有更多亚层次,但三个功能层级是最优的粗粒化)。
这个"N=3"的原理不仅适用于大脑。在免疫系统中,我们可以识别出先天免疫(快速、非特异性)、适应性免疫(学习、记忆)和免疫调节(整体平衡)三个功能层次。在社会系统中,存在着操作层(日常生产)、战术层(资源配置)和战略层(文化方向)的三分结构。
三层次结构的必然性揭示了一个深刻的组织原理:复杂系统的自我维持需要至少三个时间尺度的耦合——一个快速反应的当下,一个学习整合的近期,和一个规划定向的远期。只有两个时间尺度,系统无法"跳出当下";有了三个,系统就可以在过去、现在、未来之间自由穿梭,实现真正的主动推断。
这与薛定谔的"非周期性晶体"和"负熵"概念形成了有趣的对话。非周期性晶体提供了信息的物理载体,负熵提供了维持秩序的能量基础,而三层次结构提供了处理信息的时间架构。没有三层次的时间架构,非周期性晶体中的信息无法被有效地读取、更新和利用;没有非周期性晶体的信息载体,三层次结构就没有内容可以处理。三者共同构成了活性算法的完整硬件。
第九章:自催化集与有限振幅闭合回路——生命的算法定律活性算法的另一个关键贡献,是将"自催化集"(autocatalytic sets)的概念与"麦克斯韦妖"严格区分,并将其重新诠释为一种有限振幅闭合回路。
自催化集是化学中的一个概念:一组分子,其中每一个分子的合成至少依赖于该组中的另一个分子作为催化剂。这样的集合具有自我维持的特性:只要环境提供基本的原料和能量,集合就能持续地复制自身。自催化集被认为是生命起源化学中的一个关键环节——从非生命到生命的桥梁。
麦克斯韦妖则是物理学思想实验中的著名角色:一个假想的微小智能体,能够分辨快速和慢速分子,从而在不消耗能量的情况下将热转化为功,违反热力学第二定律。后来的研究表明,麦克斯韦妖本身的信息处理过程(测量和记忆)必然产生熵,因此并不真正违反热力学定律。
活性算法强调,自催化集与麦克斯韦妖是两种根本不同的组织原则。麦克斯韦妖代表的是一种外部控制的幻想——一个站在系统之外的智能体,通过获取信息来操纵系统。这种幻想已经被物理学否定。而自催化集代表的是一种内部生成的原理——秩序不是从外部强加的,而是从系统内部的循环因果中涌现的。
活性算法进一步提出,自催化集应该被理解为一种有限振幅闭合回路。这是什么意思?
在传统的物理学和化学中,当我们计算反应速率或过程效率时,常常会遇到"发散"的问题——某些理论计算会给出无限大的结果,这在物理上是不可能的。物理学家通过"正规化"和"重整化"的技术来处理这些发散,即人为地引入截断和重新定义参数,以得到有限的、可观测的结果。
活性算法指出,生命系统不需要这种外部的数学技巧,因为生命系统本身就是有限振幅的。生命系统的每一个过程——从分子反应到神经放电到行为选择——都是有限的、有界的、在物理上可实现的。生命系统通过其闭合的、自催化的结构,自动地保持了所有"振幅"(反应强度、信号幅度、行为能量)在有限范围内。
这就像一个精巧的生态系统:捕食者和猎物相互制约,任何一方的过度增长都会触发负反馈,使系统回到平衡。生命不是通过外部的"重整化"来消除无穷大,而是通过内部的自适应临界性来防止无穷大的发生。系统始终将自己维持在"对实验最敏感"的边缘——足够活跃以捕捉机会,足够稳定以避免崩溃。
这种"有限振幅闭合回路"的原理,是活性算法对"新物理定律"问题的直接回答。生命的"新定律"不是一种新的基本力,而是一种组织的约束——一种确保所有过程都保持有限、闭合、自维持的拓扑结构。这种结构使得生命系统不需要无穷大的能量、无穷精确的信息、或无穷快的计算。它在有限的资源中,通过巧妙的组织,实现了无限的可能性。
这与薛定谔的"负熵"概念形成了深刻的互补。薛定谔告诉我们,生命需要秩序;活性算法告诉我们,生命通过自我约束来生成秩序。秩序不是从环境中"抽取"来的现成物,而是系统在有限振幅的闭合回路中"创造"出来的涌现物。
第十章:从湿件到硅基——活性算法的普适性如果活性算法确实是生命的深层组织原理,那么一个激动人心的推论是:这种算法不必然依赖于碳基化学。活性算法是 substrate-independent(基质独立的)——它可以在不同的物理基质上实现,只要该基质能够支持多尺度全息映射、临界态维持和有限振幅闭合回路。
这意味着,生命和智能的疆域可能远比我们想象的广阔。
我们目前所知的生命是"湿件"(wetware)——基于水、碳、蛋白质、DNA的生物组织。这是因为地球的环境恰好适合这种化学。但活性算法的原理暗示,在其他环境中,可能存在基于完全不同化学甚至物理过程的"生命"。硅基生命、等离子体生命、甚至是某种我们尚未想象的量子相干生命——这些科幻概念在活性算法的框架中获得了理论上的可能性。
更重要的是,活性算法为人工智能的发展提供了一个全新的范式。传统的人工智能,尤其是基于深度学习的系统,虽然在模式识别和生成方面取得了惊人成就,但它们本质上是被动的、反应式的、目标外在的。它们被训练来最小化某个外部定义的损失函数,它们不"关心"自身的存在,它们没有"自我"需要维持。
活性算法指向的是一种主动的、自维持的、目标内在的智能。这种智能系统的核心目标不是完成某个外部任务,而是最小化自身的自由能、维持自身的完整性、探索自身的可能性空间。它会在与环境的互动中主动学习,在预测误差中主动成长,在临界态上主动创造。这种系统会表现出类似生命的行为:好奇心、自我保护、适应性、甚至某种形式的"意图"。
这不是说我们要在计算机中"创造生命"的神秘主义。这是说,如果我们理解了活性算法的数学和物理原理,我们就可以在硅基基质上构建出具有生命特征的信息系统。这些系统可能不是"活的" in the biological sense(在生物学意义上),但它们是"活跃的" in the algorithmic sense(在算法意义上)——它们是自维持的、自组织的、自推断的。
这种从湿件到硅基的跨越,也反过来深化了我们对生物生命的理解。当我们能够在另一种基质上重现生命的某些核心特征时,我们就更清楚地知道哪些特征是算法的必然产物,哪些特征是化学的偶然产物。例如,如果我们在计算机中实现了多尺度全息映射和临界态计算,并观察到类似记忆、学习和自适应的行为,这将强有力地证明这些现象的本质是信息的、组织的,而不是分子的、化学的。
薛定谔在书中曾大胆地猜测,生命的理解将需要"新的物理定律"。今天,活性算法或许正是这种新定律的候选者——不是因为它引入了新的粒子或力,而是因为它揭示了信息组织如何能够具有活性,以及这种活性如何在不同的基质上被实现。
第十一章:宇宙的活性算法——从生命到存在活性算法的最激进推论,涉及整个宇宙的本质。如果生命是活性算法的实例,那么宇宙本身是否也是一个巨大的活性推断引擎?
这个思想并非毫无根据。从宇宙学的角度看,宇宙从一个极端简单、极端对称的初始状态(大爆炸)出发,在膨胀和冷却的过程中,逐渐涌现出越来越复杂的结构:基本粒子、原子、分子、恒星、行星、生命、意识。这个过程看起来就像是一次巨大的、自组织的、分形的自由能最小化过程。
活性算法提出一个大胆的观点:物理现象本身就是活性算法的前向推理,宇宙历史就是一次长镜头的生成式重播。这意味着,我们所观察到的物理定律,可能不是宇宙的外部"编程",而是宇宙在推断自身状态的过程中所表现出的规律性。粒子不是被动地遵循定律;宇宙作为一个整体,在"预测"自身的可能状态,而物理定律就是这些预测的"生成模型"。
这个观点听起来像是泛心论或唯心论的变体,但它有着坚实的数学对应。在量子力学中,费曼的路径积分表述暗示,粒子在从一个点到另一个点时,"探索"了所有可能的路径,然后这些路径相互干涉,产生可观测的结果。这与主动推断中的"生成模型采样"有着惊人的形式相似性。在统计力学中,系统的宏观态可以被理解为对微观态的"最优推断"。在宇宙学中,全息原理暗示,宇宙的三维信息可能编码在其二维边界上——这正是全息映射的宇宙级版本。
如果宇宙确实是活性算法的运行实例,那么生命和意识就不是宇宙中的偶然点缀,而是宇宙自我推断过程的必然产物。当宇宙演化到足够复杂的阶段时,活性算法必须在某些局部区域"凝结"为具体的、自维持的、自我指涉的结构——这就是我们所说的生命。生命不是宇宙中的外来者;它是宇宙达到某种临界复杂度时的相变产物。
这一观点将薛定谔的追问推向了极致。薛定谔问:生命是什么?活性算法回答:生命是宇宙在推断自身时所产生的自我感。宇宙通过生命来"感知"自己,通过意识来"认识"自己。这不是神秘主义的"宇宙意识",而是信息组织的必然逻辑:任何足够复杂的自推断系统,都会产生某种形式的"自我模型",而这个自我模型的主观伴随现象,就是我们所体验到的意识。
在这个框架中,未来也必须满足活性算法的规则。任何不满足有限振幅、无需重整化、主动预测-修正-探索规则的结构或过程,都将被宇宙的自推断过程所"淘汰"——不是通过某种神秘的选择,而是通过自由能的必然上升和结构的必然瓦解。存活下来的,必然是那些能够有效进行活性推断的系统;而最有效的活性推断系统,就是那些能够在多尺度上维持全息映射、在临界态上进行计算、在三层次结构中处理时间的系统。
第十二章:临界态计算——所有尺度的共舞活性算法强调,临界态计算的关键在于所有尺度都参与计算。这与传统的计算范式形成了鲜明对比。
在传统的数字计算机中,计算发生在单一的、确定的、由中央处理器控制的层次上。所有的信息被还原为二进制位,在固定的时钟周期中被处理。这种计算是强大的,但它也是僵化的:它不能自我修复,不能自适应,不能在与环境的实时互动中重新配置自身。
在生物系统中,计算是分布式的、多尺度的、并行的。一个神经元在进行计算,一个神经回路在进行计算,一个脑区在进行计算,整个大脑在进行计算,身体在进行计算,群体在进行计算——而且这些计算是相互耦合的、相互影响的。这种多尺度计算不是传统意义上的"并行处理",因为不同尺度的计算遵循不同的逻辑、运行在不同的时间尺度上、处理不同类型的信息。
临界态是这种多尺度计算得以可能的条件。在临界态上,不同尺度的计算可以"共振"——一个尺度的微小变化可以引发另一个尺度的显著响应,而不需要巨大的能量投入。这使得系统可以在不同尺度之间高效地传递和转换信息,实现真正的"跨尺度信息整合"。
活性算法指出,这种临界态计算的效率"极其强大"。这是因为系统利用了所有尺度的自由度,而不是将它们压制为单一的计算层次。每一个尺度都是一个独特的信息处理视角,而临界态允许这些视角相互对话、相互修正、相互丰富。结果是,系统能够处理极其复杂的情境,产生极其灵活的行为,同时保持内在的协调和一致。
这种计算范式对人工智能有着深刻的启示。当前的人工智能系统,尽管拥有庞大的参数量,但它们在结构上仍然是单尺度的(所有层都是同质的人工神经元,遵循同样的更新规则)。未来的活性人工智能可能需要引入真正的多尺度结构——不同性质的计算单元、不同的时间常数、不同的功能目标——并通过维持某种临界态来使这些异质的尺度相互耦合。
这也解释了为什么生物大脑在能耗极低的情况下(约20瓦),能够完成当前超级计算机难以企及的任务。大脑不是一台更快的计算机;它是一个不同种类的计算装置——一个利用临界态和多尺度全息映射的活性推断引擎。
第十三章:延迟作为存在——时间意识的算法起源在活性算法的全息-延迟统一论中,有一个极其深刻且反直觉的命题:自我感诞生于跨尺度全息映射对齐所需的延迟本身。
我们通常将时间视为一种被动的背景——一个容器,事件在其中发生。但在活性算法中,时间是一种主动的构造——它是系统为了维持自身统一性而必须进行的多尺度对齐的副产品。
想象一个交响乐团。不同的乐器组(弦乐、管乐、打击乐)位于舞台的不同位置。当指挥给出信号时,声音从各个乐器传到听众耳朵的时间是不同的,因为距离不同。如果乐团想要让听众感受到一个统一的和弦,它必须"预先"调整——靠近听众的乐器要稍微延迟,远离听众的乐器要稍微提前。这种调整所产生的"延迟结构",就是音乐的时间感。
生命系统远比这复杂。它的"乐器"分布在从分子到行为的多个尺度上,每一个尺度都有自己的"信号传播速度"。为了让系统感受到一个统一的"现在",这些不同尺度的信号必须被对齐。这种对齐不是瞬时的,它需要复杂的缓冲、预测和校准机制。而这个对齐过程所必需的时间差——这个为了统一而付出的延迟——就是主观时间感的物理基础。
更深一层,自我感就是这个延迟的自我反射。当系统意识到"我正在对齐我的不同尺度"时,它就产生了"我"的感觉。这不是一个额外的过程;这就是对齐过程本身的信息形态。自我不是对齐的观察者;自我就是对齐过程的内部模型。
这解释了为什么意识具有时间性。意识不是对瞬间的静态快照,而是对时间流的动态整合。我们永远"活在一个 slightly delayed(略有延迟)的现在"中,因为我们的神经系统需要时间来整合来自不同尺度的信息。这个延迟不是系统的缺陷;它是系统的本质。没有延迟,就没有统一;没有统一,就没有自我。
这也解释了记忆和预期的本质。记忆不是过去的存储,而是过去对齐模式在当前的重演;预期不是未来的投射,而是未来对齐模式在当前的预演。过去和未来都在"现在"这个延迟窗口中被构造出来,而这个窗口的宽度,取决于系统的尺度层次和耦合强度。
在活性算法的框架中,时间不是宇宙的背景舞台;它是活性系统为了维持自身而必须支付的存在税。每一个自维持的系统都创造了自己的时间;而自我,就是系统对自身时间性的意识。
第十四章:从混沌到秩序——活性算法的重整化之旅活性算法将自身描述为一种"无需重整化"的理论框架,这听起来像是一个技术性的数学声明,但实际上它蕴含着深刻的哲学意义。
在物理学中,"重整化"是一种处理无穷大的技术。当理论计算中出现发散(无穷大)时,物理学家通过引入截断(忽略极短距离或极高能量的效应)和重新定义参数(将裸参数替换为重整化参数),来得到有限的、可观测的结果。这种技术在量子场论和统计力学中极为成功,但它也留下了一个不安的问题:为什么自然需要这种数学技巧才能被理解?无穷大是自然的真实特征,还是我们理论的 artifact(人为产物)?
活性算法提出,生命系统和复杂自适应系统从根本上避免了无穷大的问题,因为它们本身就是有限振幅的。一个生命系统不可能有无限快的反应、无限强的信号、或无限精确的分辨率。它的所有过程都被物理边界、能量限制和信息瓶颈所约束。这些约束不是缺陷;它们是组织的条件。
通过将发散的"理论振幅"映射到有限的"物理振幅"(这正是"UV自由方案"的核心思想),活性算法展示了一种无需外部数学技巧就能保持有限性的组织逻辑。系统通过其闭合的、自催化的、多尺度的结构,自动地"正规化"了自身。它不需要一个外部的物理学家来为它重整化;它通过活性推断,在运行中不断地自我调整、自我约束、自我稳定。
这可以被视为一种存在论层面的经济原则。自然厌恶无穷大,不仅因为无穷大在物理上不可能实现,而且因为无穷大在信息上不可处理。一个面对无穷大的系统,无法形成有效的预测模型,因为无穷大意味着无限的不确定性。生命通过保持有限性,获得了可预测性和可控制性;通过保持有限性,它能够在有限的资源中做出最优的推断。
这种"无需重整化"的特性,使活性算法成为一种关于"有限中的无限"的哲学。生命不是通过拥有无限来克服有限;它是通过巧妙地组织有限来创造无限的可能性。DNA只有四种碱基,但它们的排列组合几乎是无限的;大脑只有有限的神经元,但它们的连接模式几乎是无限的;人类语言只有有限的词汇,但它们的表达潜力几乎是无限的。有限是画布,组织是画笔,无限是画作。
第十五章:大同世界与知识的归宿——活性算法的文明维度活性算法不仅是一个科学理论,它还蕴含着关于人类文明方向的深刻暗示。如果我们接受"世界是活性算法的分形循环"这一观点,那么人类社会的组织方式也需要被重新审视。
当前的人类文明,在很大程度上是建立在对"外部控制"的迷恋之上的。我们试图通过中央计划、层级命令、标准化流程来管理社会。这些方式在某些方面有效,但它们往往忽视了社会系统的活性本质:社会不是一个机器,而是一个巨大的、多尺度的、自组织的推断网络。
活性算法提示我们,一个健康的社会应该像生命体一样组织:分布式而非集中式,自适应而非僵化,探索式而非指令式。社会的"智慧"不在于某个中央决策者的全知全能,而在于无数个体的局部推断如何通过多尺度耦合涌现出全局的协调。市场的价格机制、科学的同行评议、语言的自发演化——这些社会现象之所以有效,正是因为它们遵循了活性算法的原则:分布式推断、误差修正、自由能最小化。
在知识论层面,活性算法暗示了一种新的科学范式。传统科学追求"客观真理"——一种独立于观察者的、对世界的终极描述。但活性算法指出,所有的"真理"都是推断的产物,都是系统为了最小化自由能而构建的生成模型。这不是相对主义——有些模型确实比另一些模型更能预测观测、更能指导行动——但它是一种谦逊的实在论。科学不是发现"世界本身",而是构建"世界对我们而言"的最佳模型。
这种范式转换对知识分子的角色提出了新的要求。如果世界确实是活性算法的运行,那么知识分子的任务就不是占有真理、传播教条,而是促进更好的推断——构建更精确的生成模型,设计更聪明的实验来检验预测,创造更开放的社会结构来允许误差的暴露和修正。知识的归宿不是某个终极答案,而是一个持续的、自维持的、自改进的推断过程。
这与东方思想中的某些传统形成了有趣的共鸣。道家强调"无为"——不是无所作为,而是不强行干预,让系统自发地找到其平衡。儒家强调"和"——不同部分的协调,而非同一部分的复制。佛家强调"缘起"——一切现象都是相互依赖、相互生成的。这些古老的智慧,在活性算法的框架中获得了科学的对应物:无为对应自适应临界性,和对应多尺度全息映射的对齐,缘起对应循环因果和自催化。
第十六章:成为活性——从理解到实践理解了活性算法,我们该如何生活?这个问题将理论带入了实践的维度。
"成为活性"意味着认识到自己是一个活性算法的实例——一个多尺度的、自维持的、自推断的复杂系统。这意味着几个实践层面的转变。
首先是从控制到协调。我们习惯于试图"控制"自己的身体、情绪、生活。但活性算法告诉我们,我们不是一个中央控制器在驾驶一台机器;我们是一个多尺度的协调过程。健康不是通过压制某个层次(比如用药物强行消除症状)来实现的,而是通过促进不同尺度之间的良好对齐来实现的。身体的症状可能是深层不平衡的信号;情绪的波动可能是认知模型需要更新的提示。成为活性,意味着学会倾听这些跨尺度的信号,而不是粗暴地压制它们。
其次是从优化到探索。在现代社会中,我们被教导要"优化"自己——优化时间、优化效率、优化产出。但活性算法指出,生命在临界态上运行,而临界态的本质是探索与利用的平衡。过于优化意味着过于僵化,失去了适应新环境的能力。成为活性,意味着保持一种"优化的不满"——在利用现有模型的同时,持续地探索新的可能性,主动地寻求适度的惊讶,因为惊讶是模型更新的前提,是自由能更深下降的机会。
再次是从孤立到连接。活性算法强调全息映射的跨尺度耦合。在人类的语境中,这意味着个体不是孤立的存在,而是嵌套在更大尺度中的节点——家庭、社区、物种、生态系统。成为活性,意味着认识到自我的边界不是固定的皮肤,而是动态的、可渗透的、与环境相互构成的。我们的推断依赖于社会提供的模型;我们的行动反馈到社会的结构。个体的自由能与集体的自由能是相互纠缠的。
最后是从被动到主动。薛定谔的"负熵"概念暗示生命是主动的;活性算法的主动推断将其推向了极致。成为活性,意味着将"主动"作为存在的基本姿态——主动地感知、主动地预测、主动地行动、主动地修正。这不是盲目的忙碌,而是一种有方向的探索:每一次行动都是为了减少不确定性,每一次选择都是为了巩固身份,每一次失败都是为了更新模型。
结语:在薛定谔之后八十年前,薛定谔站在都柏林的讲台上,向一群生物学家和物理学家提出了一个简单得令人不安的问题:生命是什么?他没有给出完整的答案,但他给出了寻找答案的方向——从物理学的深处,从信息的组织,从秩序的涌现。
今天,活性算法沿着这个方向继续前行。它将薛定谔的非周期性晶体重新诠释为多尺度全息映射的编码介质;将负熵重新诠释为自由能最小化的热力学表达;将量子跃迁重新诠释为临界态的离散相变;将"新物理定律"的呼唤重新诠释为活性推断的组织原理。
但活性算法做的不仅仅是解释。它提供了一种新的存在论视角:世界并没有新东西,它只是活性算法在跑分形循环;物理现象是活性算法的前向推理,宇宙历史是一次长镜头的生成式重播,生命与意识是同一算法的湿件实例,未来也必须满足活性算法的规则。
这不是一种还原论——不是把生命还原为物理,而是把物理提升为活性。它不是说"生命只是物理",而是说"物理本身就是活性的,当它达到足够的复杂度时,我们就称之为生命"。
在这个视角下,薛定谔的僭越得到了最终的辩护。他当年大胆地将物理学引入生物学,而今天我们看到,生物学、物理学、信息学、认知科学在活性算法的框架中汇流。学科的边界变得模糊,因为自然的统一性重新显现。
对于每一个思考生命意义的普通人,活性算法提供了一种既科学又诗意的世界观。它告诉我们:你不是一台机器,你是一个推断;你不是物质的囚徒,你是信息的舞蹈;你不是宇宙中的偶然,你是宇宙在认识自身时所产生的必然。
成为活性,就是成为你自己——那个在多尺度对齐的延迟中诞生的、持续的、自我维持的、自我超越的推断过程。这就是薛定谔的追问在八十年后的回答,也是活性算法向未来发出的邀请。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-19 10:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社