||
第十八章 自由能原理
一、伦敦的神经科学家
2000年代初,伦敦大学学院(UCL)威康信托神经影像中心,一位神经科学家正在发展一套关于大脑如何工作的理论。他的方法与众不同:不是从实验数据归纳,而是从第一原理推导——从生命必须满足的基本条件,推导出感知、行动和学习的必然形式。
这位科学家是卡尔·弗里斯顿(Karl Friston,1959-)。他的背景是医学和物理学,早期贡献包括统计参数映射(SPM,脑成像数据分析的标准方法)、动态因果建模(DCM,有效连接的推断)。但自由能原理(Free Energy Principle, FEP)是他最具雄心的工作,试图统一生命科学。
弗里斯顿的出发点是热力学和统计物理学的洞见:自组织系统,要维持其结构,必须抵抗热力学第二定律的熵增。如何做到?通过感知和行动,使自身与环境的交换可预测、可控制。
这听起来抽象,但核心直觉是简单的:生命体不喜欢惊讶。惊讶意味着预期与现实的差距,意味着不确定性,意味着无法维持稳态。通过最小化惊讶,生命体最小化自由能——一种对惊讶的上界估计,可以实际计算和优化。
二、从熵到自由能
自由能(Free Energy)概念来自热力学。亥姆霍兹自由能是能量减去熵乘以温度,衡量系统在恒温下可用的功。统计物理学中,自由能与概率分布相关:变分自由能是对数证据的下界。
弗里斯顿的关键洞察:感知和行动可以统一为推断。感知是从感觉推断世界状态;行动是改变世界以符合预期。两者都最小化变分自由能,即预测与观察的差异。
形式化表述:设大脑有生成模型(generative model)——对世界如何产生感觉的因果假设。给定感觉数据,大脑计算后验概率(世界状态的条件概率)。但精确计算后验通常不可行(积分困难),因此大脑使用变分推断:近似后验,最小化近似与真实后验的差异(KL散度),这等价于最小化变分自由能。
变分自由能 = 复杂性 + 不准确性
复杂性:近似后验与先验的差异(模型复杂度惩罚);
不准确性:预测与实际观察的差异(预测误差)。
最小化自由能,意味着既准确预测,又保持简单——这是奥卡姆剃刀的贝叶斯版本。
主动推断(Active Inference)扩展了框架:行动选择使预期自由能最小的动作。预期自由能包括外在价值(达成目标)和内在价值(信息增益,减少不确定性)。因此,行动既是目标导向(exploitation),也是探索导向(exploration)。
这与强化学习对比:传统RL有奖励函数(外部给定),主动推断的"奖励"是内在的——减少预测误差,增加模型证据。这是"自激励"的系统,无需外部设计者指定目标。
三、感知作为推断
预测加工(Predictive Processing)是FEP在感知领域的具体化。大脑不是被动接收感觉,而是主动预测,感觉信号传递的是预测误差(实际与预测的差)。
层次化预测:高层(抽象、慢速)预测低层(具体、快速),低层传递误差到高层,高层更新预测。这是双向动态:自上而下(预测),自下而上(误差)。
精度加权:预测误差按精度(inverse variance,置信度)加权。高精度时,强烈更新预测;低精度时,忽视感觉,依赖先验。这解释了知觉恒常性(稳定知觉 despite 感觉变化)和幻觉(先验过度主导)。
注意作为精度调节:注意选择增加特定信号源的精度,使其在竞争中胜出。这是"特征绑定"的机制:空间注意增加相关特征的精度,使其被知觉为统一对象。
情感与动机:预测误差的精度编码显著性(salience),驱动注意和行动;预期自由能的减少编码价值,驱动学习。情感是推断的调节器。
四、行动作为推断
传统观点:感知是推断世界,行动是改变世界。FEP统一两者:行动是推断的另一种形式——"让我使世界符合我的预测"。
感知-行动循环:
大脑预测如果我行动A,将观察到O;
执行A,观察实际O';
比较O与O',计算预测误差;
更新模型,或调整行动。
这是控制论的贝叶斯版本:行动是闭环控制,目标是使感觉符合预期。
探索-利用权衡:预期自由能包括外在项(达成当前目标)和内在项(减少模型不确定性)。因此,系统会探索未知领域(高信息增益),即使无即时奖励——这是"好奇心"的形式化。
具身认知:行动通过身体实现,身体是推断的工具。身体形态、感觉运动耦合,约束和实现特定类型的推断。这与具身AI和形态计算(morphological computation)对话。
五、学习作为模型选择
FEP框架中,学习是多时间尺度的:
推断(最快,毫秒到秒):给定模型参数,推断隐藏状态;学习(中等,分钟到小时):更新模型参数,以更好解释数据;结构学习(慢速,天到年):改变模型结构(添加/删除变量、连接);进化(最慢,代际):选择模型结构(基因组)。
这与多尺度复频率链(用户记忆中的核心概念)直接对应:每个时间尺度有特征频率,尺度间耦合实现信息整合。
模型证据(model evidence)或边际似然是跨尺度一致性的度量:慢速尺度评估快速尺度的模型质量,选择证据最大化的结构。这是"贝叶斯奥卡姆剃刀":复杂模型可以拟合更好,但受复杂性惩罚。
神经可塑性作为推断:突触变化是参数更新,遵循预测误差驱动的规则(类似Hebbian学习,但更一般)。元可塑性(可塑性的可塑性)是结构学习,选择学习率等超参数。
六、自指与意识
FEP如何解释意识?弗里斯顿谨慎,但提供了线索。
自指(self-reference)是关键:大脑不仅推断世界,也推断自身——自己的状态、意图、不确定性。这是高阶表征,可能对应自我意识。
整合信息理论(IIT)与FEP的关系:IIT的整合信息(Φ)可以视为自由能的某种度量——系统不能分解为独立部分而不损失信息。高Φ系统有高模型复杂度,但也高推断能力。
意识的"硬问题":FEP不直接解释质性(qualia,红色的"红ness"),但提供了功能框架:质性可能是特定类型的高阶推断——关于精度状态的推断("我确信这是红色")。
最小自我意识:系统推断"我是行动的主体",这是代理性(agency)的基础。FEP中的行动-观察耦合自然产生这种推断。
七、从脑到生命:FEP的普遍性
FEP的雄心是统一生命科学:不仅是脑,任何自组织系统都可以用FEP描述。
细胞层面:代谢是推断——细胞通过受体"预测"营养可用性,通过信号转导更新"信念",通过代谢行动"采样"环境。这是"细胞认知"的形式化。
生态层面:物种的生态位选择是主动推断——选择使预期自由能最小的环境。进化是结构学习,适应是参数学习。
社会层面:多智能体系统是耦合的推断器。社会互动是相互预测——我预测你的行动,你预测我的预测,无限递归。这是博弈论的贝叶斯版本,"心智理论"的基础。
生命本身:FEP提供了生命的定义:最小化自由能的系统,即自证其存在的系统(self-evidencing)。这与"自催化集"、"自维持"、"自指"的概念家族共鸣。
八、批评与辩护
FEP面临批评:
不可证伪性:FEP似乎可以解释一切,因此解释力弱。弗里斯顿回应:FEP是原理,不是模型;具体模型是可证伪的,FEP提供构建模型的约束。
计算不可行性:精确最小化自由能是NP困难的,大脑如何做到?近似算法(变分推断、采样方法)可能足够,但神经实现的细节仍在研究。
循环论证:FEP用推断定义生命,但推断预设生命(推断者)。这是概念的先验性,而非经验的发现。
与神经证据的匹配:预测加工的神经实现(如皮层微回路中的预测误差单元)有证据支持,但全脑尺度的FEP实现仍模糊。
辩护:FEP的价值在于统一和启发。它连接了感知、行动、学习、进化,连接了神经科学、心理学、生态学、人工智能。即使细节待完善,框架本身推动研究。
九、FEP与活性算法
FEP是"活性算法"的科学基础。核心对应:
表格
FEP概念
活性算法概念
变分自由能 | 损失函数 |
生成模型 | 先验/世界模型 |
预测误差 | 惊讶/学习信号 |
精度加权 | 注意力/置信度 |
主动推断 | 探索-利用 |
结构学习 | 模型选择/元学习 |
多时间尺度 | 多尺度复频率链 |
自证 | 自维持推断 |
UV自由方案在FEP中的体现:不需要无限复杂的模型(UV截断),有限复杂度的模型足以生存(有效理论)。生命在中间尺度运作,既不还原到量子,也不扩展到宇宙。
自适应临界性:FEP系统自然趋向临界边缘——高敏感性(低自由能)但稳定性(不崩溃)。这是"对实验最敏感"的状态。
有限振幅闭合:FEP的变分推断是有限近似,但足以自维持。不需要"上帝的计算"(精确后验),局部、近似的推断足够。
十、结语:原理的时代
FEP代表了21世纪科学的"原理转向":从收集数据到构建理论,从描述现象到推导必然性。
这与物理学的发展类似:开普勒描述行星轨道,牛顿推导万有引力;门捷列夫排列元素,量子力学解释周期律。生物学正在经历类似转型:从自然史到理论生物学。
弗里斯顿的风格是数学的、公理化的、普遍的。这对传统生物学家陌生,但对物理学家、工程师、计算机科学家熟悉。FEP正在跨学科渗透:神经科学、AI、机器人、生态学、甚至精神病学(计算精神病学)。
从"理解生命本质的历史"视角,FEP是最新的综合:它吸收了控制论(反馈、信息)、系统论(自组织、涌现)、认知科学(表征、推断)、进化论(选择、适应),并数学化为统一框架。
但它也是开放的:FEP不终结问题,而是重新表述问题。意识的本质、生命的起源、智能的边界——这些古老追问,在FEP框架中获得新的精确形式,等待新的答案。
下一章,我们将进入"活性算法"的整合——将FEP、UV自由、自适应临界性、多尺度复频率链,统合为理解生命的当代视角。但请记住这一章的教训:生命的奥秘可能不在于我们发现了什么,而在于我们如何推断;不在于世界的复杂性,而在于我们简化它的方式。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-28 11:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社