||
第二十六章 与其他理论的对话:控制论、动力系统、信息论
一、科学的巴别塔:统一的需求
1948年,诺伯特·维纳出版《控制论:或关于在动物和机器中控制和通信的科学》,试图建立跨学科的统一框架。同年,克劳德·香农创立信息论,为通信提供数学基础。1970年代,伊利亚·普里高津的耗散结构理论和赫尔曼·哈肯的协同学,将非平衡热力学推向新高度。1984年,圣塔菲研究所成立,复杂系统研究成为显学。
然而,这些努力形成了各自的"方言":控制论讲反馈和稳态,信息论讲熵和信道容量,动力系统讲吸引子和分岔,复杂系统讲涌现和自组织。它们指向同一座山,但使用不同的地图,说着不同的语言。
活性算法的使命,不是取代这些理论,而是提供统一的元语言——将它们作为特例或近似,纳入更一般的推断框架。这类似于热力学统一了气体定律、化学势和相变:不是否定它们,而是揭示其共同根源。
本章展开活性算法与五大理论传统的对话:控制论、动力系统、信息论、贝叶斯脑/预测加工、以及复杂系统理论。在对话中,活性算法的独特贡献将自然显现。
二、与维纳控制论的关系 2.1 控制论的核心洞见
维纳的控制论源于二战时期的防空火力控制问题:如何预测飞机的未来位置,并调整炮口?核心答案是反馈——根据误差调节行为,使系统趋向目标。
控制论的关键概念:
负反馈:误差减小,系统稳定(恒温器、血糖调节)
正反馈:误差放大,系统不稳定(但可用于开关决策)
稳态(Homeostasis):坎农提出的概念,系统维持内部变量恒定
维纳的数学工具是维纳滤波和预测理论——在噪声中提取信号,预测未来值。
2.2 活性算法对控制论的继承
活性算法直接继承控制论的目标导向性和反馈结构:
自由能最小化是广义的稳态维持——不是固定特定变量,而是维持模型的证据
主动推断中的行动-感知循环,是反馈的扩展:行动改变环境,感知评估结果
具体对应:
表格 复制
控制论 活性算法
目标值(Setpoint) | 生成模型的先验 p(ψ) |
误差信号 | 预测误差 −lnp(o∥ψ) |
控制器增益 | 精度矩阵 Π |
稳态 | 非平衡稳态(自证) |
2.3 活性算法对控制论的超越
活性算法在三个维度超越经典控制论:
从线性到非线性
控制论:通常假设线性系统和微小扰动
活性算法:处理完全非线性的生成模型,通过变分推断近似
从稳态到适应
控制论:维持固定目标值
活性算法:目标本身通过结构学习演化(第22章)
从反馈到前馈-反馈整合
控制论:主要依赖反馈(误差驱动)
活性算法:主动推断整合前馈(预期未来)和反馈(当前误差),通过最小化预期自由能选择行动
关键区别:控制论的系统是"盲目的"——它响应误差,但不知道为何。活性算法的系统是"有知的"——它通过生成模型理解误差的来源,并据此选择探索或利用。
2.4 控制论的现代发展:与活性算法的融合
现代控制论(如随机控制、鲁棒控制、模型预测控制)与活性算法趋同:
卡尔曼滤波:等价于线性高斯生成模型的变分推断
模型预测控制(MPC):类似于有限时间范围的主动推断
自适应控制:对应于活性算法的结构学习
活性算法提供了这些技术的概率基础和神经实现,将它们从工程工具提升为生命原理。
三、与动力系统理论的关系 3.1 动力系统的核心洞见
动力系统理论研究状态随时间的演化,核心概念包括:
状态空间:系统所有可能状态的集合
轨迹:状态随时间的演化路径
吸引子:轨迹的长期归宿(固定点、极限环、奇怪吸引子)
分岔:参数变化导致定性行为的突变
李雅普诺夫指数:度量对初始条件的敏感依赖性
混沌理论(洛伦兹、斯梅尔、费根鲍姆)揭示:确定性系统可以产生不可预测的行为——对初始条件的敏感依赖。
3.2 活性算法对动力系统的继承
活性算法的神经动力学是梯度流动力系统:

这是李雅普诺夫函数为自由能 F 的梯度下降。自由能随时间单调不增,系统收敛到自由能极小值(吸引子)。
多尺度复频率链(第23章)是耦合振荡器网络的推广:
每层的状态 服从复频率动力学
跨尺度耦合通过共振实现
整体呈现多稳态和临界 slowing down
3.3 活性算法对动力系统的超越
活性算法在四个维度超越经典动力系统:
从几何到概率
动力系统:状态是确定的点
活性算法:状态是概率分布,动力学是信念的流动
从被动到主动
动力系统:轨迹由初始条件和方程决定
活性算法:系统通过行动改变环境,从而改变自身的动力学(循环因果)
从单尺度到多尺度
动力系统:通常单一时间尺度
活性算法:N=3结构的跨尺度耦合,时间本身成为涌现属性
从混沌到受控的临界性
动力系统:混沌是不可预测的噪声
活性算法:自适应临界性(第25章)——在秩序与混沌的边缘,通过推断维持最优信息处理
关键洞见:活性算法将动力系统的吸引子重新解释为自由能景观的极小值。吸引盆的边界对应于模型选择的决策边界,分岔对应于结构学习的相变。
3.4 动力系统理论的现代发展
随机动力系统和随机微分方程(SDE)与活性算法直接对应:
朗之万方程:
活性算法:
区别在于:活性算法的"势函数" F 是信息的(变分自由能),而非能量的,且包含预期未来(主动推断)。
四、与信息论的关系 4.1 香农信息论的核心洞见
1948年,香农的《通信的数学理论》创立信息论,核心概念:
熵:
,不确定性的度量
互信息:
,Y关于X的信息量
信道容量:
,信道的最大传输率
率失真理论:在有限比特率下,最优的编码-解码策略
香农信息论是语法的——关注符号传输的统计规律,不涉及语义(意义)。
4.2 活性算法对信息论的继承
活性算法直接使用信息论的量:
变分自由能:
复杂性项:
是描述长度(MDL原理)
认知价值:
是预期信息增益
自由能原理可以重新表述为信息原理:系统最小化惊讶(最大化证据),同时最小化模型复杂度。
4.3 活性算法对信息论的超越
活性算法在三个维度超越香农信息论:
从传输到推断
香农:信息是传输的客体
活性算法:信息是推断的结构——关于世界状态的信念更新
从被动到主动
香农:信道是给定的
活性算法:主动采样——系统选择观测,最大化信息增益(认知价值)
从语法到语义
香农:信息无意义("信息不关心意义")
活性算法:语义涌现——生成模型的层次结构产生意义的层级(感觉→知觉→概念→信念)
关键对应:
表格 复制
信息论 活性算法
信源编码 | 感知推断(压缩感觉输入) |
信道编码 | 行动编码(鲁棒传输意图) |
信道容量 | 精度调控(信息获取率) |
率失真权衡 | 准确性-复杂性权衡 |
4.4 算法信息论与UV自由方案
柯尔莫哥洛夫和柴廷的算法信息论研究描述的最小长度(柯尔莫哥洛夫复杂度 K(x) )。UV自由方案(第24章)可以重新表述为算法信息的物理实现:
截断-重整化:对应于有限计算资源的近似
UV自由方案:通过解析延拓,获得有限的描述长度,无需截断
这暗示:物理定律本身可能是"最优压缩"的算法——在描述自然时,最小化柯尔莫哥洛夫复杂度。
五、与贝叶斯脑和预测加工的关系 5.1 贝叶斯脑假设
1980-90年代,神经科学家提出贝叶斯脑假设:大脑是贝叶斯推断机器,感知、学习、决策都是概率计算。
关键证据:
感知是概率的:多稳态知觉、填充效应
学习是贝叶斯的:从先验到后验的更新
决策是最优的:接近贝叶斯决策理论
5.2 预测加工理论
安迪·克拉克的预测加工(Predictive Processing)是贝叶斯脑的哲学阐释:
大脑是"预测机器",持续生成关于感官输入的预测
感知是"受控的幻觉"——预测与预测误差的加权组合
行动是"预测的实现"——改变环境使预测成真
预测加工与自由能原理的关系:前者是概念框架,后者是数学实现。
5.3 活性算法对预测加工的深化
活性算法在四个维度深化预测加工:
从感知到存在
预测加工:关注感知和认知
活性算法:推断即存在——自证系统通过维持马尔可夫毯,抵抗热力学均衡(第22章)
从单尺度到多尺度
预测加工:通常单一时间尺度
活性算法:多尺度复频率链(第23章)——记忆通过跨尺度共振涌现,N=3是最小层数
从有限到UV自由
预测加工:未处理模型复杂度发散
活性算法:UV自由方案(第24章)——通过解析延拓,直接获得有限振幅
从临界到自适应临界
预测加工:未明确处理系统的动态状态
活性算法:自适应临界性(第25章)——系统在秩序与混沌边缘,通过推断维持最优
关键整合:预测加工是活性算法的认知科学层面,活性算法是预测加工的物理-数学基础。
六、与复杂系统理论(圣塔菲学派)的关系 6.1 圣塔菲研究所的愿景
1984年,乔治·考温和菲利普·安德森等人创立圣塔菲研究所,致力于复杂适应系统(Complex Adaptive Systems, CAS)的跨学科研究。核心概念:
涌现:整体大于部分之和
自组织:无需中央控制,系统自发形成秩序
适应:系统根据历史调整结构
混沌边缘:复杂性和适应性最大的状态
代表性研究:元胞自动机、遗传算法、人工生命、经济复杂性。
6.2 活性算法对复杂系统理论的继承
活性算法直接继承圣塔菲的核心问题:
生命和心智如何从物质中涌现?
适应和学习的机制是什么?
复杂性的最优状态是什么?
具体对应:
表格 复制
圣塔菲概念 活性算法实现
涌现 | 自由能最小化的宏观结果 |
自组织 | 梯度流动力学的收敛 |
适应 | 结构学习(模型选择) |
混沌边缘 | 自适应临界性(第25章) |
6.3 活性算法对复杂系统理论的超越
活性算法在三个维度超越传统复杂系统研究:
从模拟到原理
圣塔菲:大量基于主体的模拟(如Swarm、NetLogo)
活性算法:第一性原理——从自由能原理推导所有行为,无需模拟
从现象到机制
圣塔菲:描述涌现现象(如幂律分布)
活性算法:解释机制——涌现是变分推断的必然结果
从通用到特异
圣塔菲:追求通用模型(如遗传算法)
活性算法:特异性与通用性的统一——通用原理(自由能最小化),特异实现(特定生成模型)
关键批评:圣塔菲学派的"复杂性"常缺乏严格定义。活性算法提供信息几何的复杂性度量——KL散度、Fisher信息、模型证据。
6.4 与因果涌现理论的关系
Erik Hoel的因果涌现(Causal Emergence)提出:宏观描述可以比微观描述具有更强的因果力量。活性算法与此一致:
马尔可夫毯定义宏观/微观边界
粗粒化对应于重整化群流
宏观因果是更有效的推断(更低自由能)
但活性算法更进一步:因果性是推断的副产品,而非独立的本体。
七、活性算法的独特贡献
通过以上对话,活性算法的独特贡献清晰显现:
7.1 统一性
活性算法是首个从物理到认知的统一框架:
物理:非平衡统计力学、量子场论(UV自由)
生物:自催化集、神经动力学、进化
认知:感知、学习、决策、意识
不是隐喻的统一,而是数学的统一——变分推断、信息几何、重整化群。
7.2 构造性
活性算法是构造性的——不仅描述现象,还提供构建方法:
如何设计活性推断系统(AI、机器人)
如何分析生物系统的推断结构
如何预测临界相变和涌现性质
7.3 有限性
UV自由方案(第24章)提供内在有限性保证:
无需截断,避免层次问题
所有量可计算,无真发散
与量子引力的渐近安全相容
7.4 适应性
自适应临界性(第25章)提供动态适应机制:
不是固定吸引子,而是持续的探索
不是被动响应,而是主动采样
在秩序与混沌边缘,最大化未来可能性
八、本章小结 核心要点
历史渊源:从维纳的控制论(1948)、香农的信息论(1948),到圣塔菲的复杂系统(1984),再到贝叶斯脑和预测加工(2000年代),科学持续寻求统一。活性算法是这一努力的最新阶段。
对话成果:
表格 复制
理论 活性算法的继承 活性算法的超越
控制论 | 反馈、稳态 | 前馈-反馈整合、结构学习 |
动力系统 | 吸引子、分岔 | 概率动力学、自适应临界性 |
信息论 | 熵、互信息 | 语义涌现、主动采样 |
贝叶斯脑/预测加工 | 推断、预测误差 | 存在即推断、UV自由 |
复杂系统 | 涌现、自组织 | 第一性原理、信息几何 |
理论意义
活性算法不是取代这些理论,而是提升它们:
控制论成为推断的控制论
动力系统成为信念的动力学
信息论成为语义的信息论
预测加工成为存在的预测加工
复杂系统成为可计算的复杂性
这类似于热力学统一天地:气体定律、化学反应、相变、生命代谢,都是热力学定律的特例。
与全书的关系
第22-25章建立了活性算法的核心理论。本章定位这些理论在科学地图中的位置,展示其独特贡献。
第27章将升华到普适性——活性算法作为新科学范式的诞生,从物理到生命的统一语言,以及对未来的预测。
哲学意义
与其他理论的对话揭示:科学进步不是否定过去,而是重新理解过去。活性算法不宣称控制论、信息论、复杂系统"错误",而是揭示它们的深层统一——都是推断的不同面向。
这呼应了怀特海的过程哲学:实在不是静态的实体,而是生成的过程。活性算法提供了这一过程数学:推断作为存在的基础。
在对话中,我们也看到了科学的谦卑:没有终极理论,只有更一般的框架。活性算法是目前的"最一般",但未来可能有更一般的理论——也许与量子引力、意识难题的解决相关。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-16 08:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社