别人成仙得道,我是白骨成精分享 http://blog.sciencenet.cn/u/qiaoqiao1980 寻找新物理学

博文

生命的本质 第十八章 自由能原理

已有 168 次阅读 2026-4-28 09:19 |个人分类:我思故我在|系统分类:观点评述

第十八章 自由能原理    

    一、伦敦的神经科学家

    2000年代初,伦敦大学学院(UCL)威康信托神经影像中心,一位神经科学家正在发展一套关于大脑如何工作的理论。他的方法与众不同:不是从实验数据归纳,而是从第一原理推导——从生命必须满足的基本条件,推导出感知、行动和学习的必然形式。

    这位科学家是卡尔·弗里斯顿(Karl Friston,1959-)。他的背景是医学和物理学,早期贡献包括统计参数映射(SPM,脑成像数据分析的标准方法)、动态因果建模(DCM,有效连接的推断)。但自由能原理(Free Energy Principle, FEP)是他最具雄心的工作,试图统一生命科学

    弗里斯顿的出发点是热力学和统计物理学的洞见:自组织系统,要维持其结构,必须抵抗热力学第二定律的熵增。如何做到?通过感知和行动,使自身与环境的交换可预测、可控制

    这听起来抽象,但核心直觉是简单的:生命体不喜欢惊讶。惊讶意味着预期与现实的差距,意味着不确定性,意味着无法维持稳态。通过最小化惊讶,生命体最小化自由能——一种对惊讶的上界估计,可以实际计算和优化。

    二、从熵到自由能

    自由能(Free Energy)概念来自热力学。亥姆霍兹自由能是能量减去熵乘以温度,衡量系统在恒温下可用的功。统计物理学中,自由能与概率分布相关:变分自由能对数证据的下界

    弗里斯顿的关键洞察:感知和行动可以统一为推断。感知是从感觉推断世界状态;行动是改变世界以符合预期。两者都最小化变分自由能,即预测与观察的差异

    形式化表述:设大脑有生成模型(generative model)——对世界如何产生感觉的因果假设。给定感觉数据,大脑计算后验概率(世界状态的条件概率)。但精确计算后验通常不可行(积分困难),因此大脑使用变分推断:近似后验,最小化近似与真实后验的差异(KL散度),这等价于最小化变分自由能

    变分自由能 = 复杂性 + 不准确性

  • 复杂性:近似后验与先验的差异(模型复杂度惩罚);

  • 不准确性:预测与实际观察的差异(预测误差)。

    最小化自由能,意味着既准确预测,又保持简单——这是奥卡姆剃刀的贝叶斯版本。

    主动推断(Active Inference)扩展了框架:行动选择使预期自由能最小的动作。预期自由能包括外在价值(达成目标)和内在价值(信息增益,减少不确定性)。因此,行动既是目标导向(exploitation),也是探索导向(exploration)。

    这与强化学习对比:传统RL有奖励函数(外部给定),主动推断的"奖励"是内在的——减少预测误差,增加模型证据。这是"自激励"的系统,无需外部设计者指定目标。

    三、感知作为推断

    预测加工(Predictive Processing)是FEP在感知领域的具体化。大脑不是被动接收感觉,而是主动预测,感觉信号传递的是预测误差(实际与预测的差)。

    层次化预测:高层(抽象、慢速)预测低层(具体、快速),低层传递误差到高层,高层更新预测。这是双向动态:自上而下(预测),自下而上(误差)。

    精度加权:预测误差按精度(inverse variance,置信度)加权。高精度时,强烈更新预测;低精度时,忽视感觉,依赖先验。这解释了知觉恒常性(稳定知觉 despite 感觉变化)和幻觉(先验过度主导)。

    注意作为精度调节:注意选择增加特定信号源的精度,使其在竞争中胜出。这是"特征绑定"的机制:空间注意增加相关特征的精度,使其被知觉为统一对象。

    情感与动机:预测误差的精度编码显著性(salience),驱动注意和行动;预期自由能的减少编码价值,驱动学习。情感是推断的调节器

    四、行动作为推断

    传统观点:感知是推断世界,行动是改变世界。FEP统一两者:行动是推断的另一种形式——"让我使世界符合我的预测"

    感知-行动循环

  1. 大脑预测如果我行动A,将观察到O

  2. 执行A,观察实际O';

  3. 比较O与O',计算预测误差;

  4. 更新模型,或调整行动。

    这是控制论的贝叶斯版本:行动是闭环控制,目标是使感觉符合预期

    探索-利用权衡:预期自由能包括外在项(达成当前目标)和内在项(减少模型不确定性)。因此,系统会探索未知领域(高信息增益),即使无即时奖励——这是"好奇心"的形式化。

    具身认知:行动通过身体实现,身体是推断的工具。身体形态、感觉运动耦合,约束和实现特定类型的推断。这与具身AI形态计算(morphological computation)对话。

    五、学习作为模型选择

    FEP框架中,学习是多时间尺度的

    推断(最快,毫秒到秒):给定模型参数,推断隐藏状态;学习(中等,分钟到小时):更新模型参数,以更好解释数据;结构学习(慢速,天到年):改变模型结构(添加/删除变量、连接);进化(最慢,代际):选择模型结构(基因组)。

    这与多尺度复频率链(用户记忆中的核心概念)直接对应:每个时间尺度有特征频率,尺度间耦合实现信息整合。

    模型证据(model evidence)或边际似然跨尺度一致性的度量:慢速尺度评估快速尺度的模型质量,选择证据最大化的结构。这是"贝叶斯奥卡姆剃刀":复杂模型可以拟合更好,但受复杂性惩罚。

    神经可塑性作为推断:突触变化是参数更新,遵循预测误差驱动的规则(类似Hebbian学习,但更一般)。元可塑性(可塑性的可塑性)是结构学习,选择学习率等超参数。

    六、自指与意识

    FEP如何解释意识?弗里斯顿谨慎,但提供了线索。

    自指(self-reference)是关键:大脑不仅推断世界,也推断自身——自己的状态、意图、不确定性。这是高阶表征,可能对应自我意识

    整合信息理论(IIT)与FEP的关系:IIT的整合信息(Φ)可以视为自由能的某种度量——系统不能分解为独立部分而不损失信息。高Φ系统有高模型复杂度,但也高推断能力

    意识的"硬问题":FEP不直接解释质性(qualia,红色的"红ness"),但提供了功能框架:质性可能是特定类型的高阶推断——关于精度状态的推断("我确信这是红色")。

    最小自我意识:系统推断"我是行动的主体",这是代理性(agency)的基础。FEP中的行动-观察耦合自然产生这种推断。

    七、从脑到生命:FEP的普遍性

    FEP的雄心是统一生命科学:不仅是脑,任何自组织系统都可以用FEP描述。

    细胞层面:代谢是推断——细胞通过受体"预测"营养可用性,通过信号转导更新"信念",通过代谢行动"采样"环境。这是"细胞认知"的形式化。

    生态层面:物种的生态位选择主动推断——选择使预期自由能最小的环境。进化是结构学习,适应是参数学习

    社会层面:多智能体系统是耦合的推断器。社会互动是相互预测——我预测你的行动,你预测我的预测,无限递归。这是博弈论的贝叶斯版本,"心智理论"的基础。

    生命本身:FEP提供了生命的定义最小化自由能的系统,即自证其存在的系统(self-evidencing)。这与"自催化集""自维持""自指"的概念家族共鸣。

    八、批评与辩护

    FEP面临批评

    不可证伪性:FEP似乎可以解释一切,因此解释力弱。弗里斯顿回应:FEP是原理,不是模型;具体模型是可证伪的,FEP提供构建模型的约束

    计算不可行性:精确最小化自由能是NP困难的,大脑如何做到?近似算法(变分推断、采样方法)可能足够,但神经实现的细节仍在研究。

    循环论证:FEP用推断定义生命,但推断预设生命(推断者)。这是概念的先验性,而非经验的发现。

    与神经证据的匹配:预测加工的神经实现(如皮层微回路中的预测误差单元)有证据支持,但全脑尺度的FEP实现仍模糊。

    辩护:FEP的价值在于统一和启发。它连接了感知、行动、学习、进化,连接了神经科学、心理学、生态学、人工智能。即使细节待完善,框架本身推动研究

    九、FEP与活性算法

    FEP是"活性算法"的科学基础。核心对应:

表格

FEP概念

活性算法概念

变分自由能

损失函数

生成模型

先验/世界模型

预测误差

惊讶/学习信号

精度加权

注意力/置信度

主动推断

探索-利用

结构学习

模型选择/元学习

多时间尺度

多尺度复频率链

自证

自维持推断

    UV自由方案在FEP中的体现:不需要无限复杂的模型(UV截断),有限复杂度的模型足以生存(有效理论)。生命在中间尺度运作,既不还原到量子,也不扩展到宇宙。

    自适应临界性:FEP系统自然趋向临界边缘——高敏感性(低自由能)但稳定性(不崩溃)。这是"对实验最敏感"的状态。

    有限振幅闭合:FEP的变分推断有限近似,但足以自维持。不需要"上帝的计算"(精确后验),局部、近似的推断足够。

    十、结语:原理的时代

    FEP代表了21世纪科学的"原理转向":从收集数据构建理论,从描述现象推导必然性

    这与物理学的发展类似:开普勒描述行星轨道,牛顿推导万有引力;门捷列夫排列元素,量子力学解释周期律。生物学正在经历类似转型:从自然史理论生物学

    弗里斯顿的风格是数学的、公理化的、普遍的。这对传统生物学家陌生,但对物理学家、工程师、计算机科学家熟悉。FEP正在跨学科渗透:神经科学、AI、机器人、生态学、甚至精神病学(计算精神病学)。

    从"理解生命本质的历史"视角,FEP是最新的综合:它吸收了控制论(反馈、信息)、系统论(自组织、涌现)、认知科学(表征、推断)、进化论(选择、适应),并数学化为统一框架。

    但它也是开放的:FEP不终结问题,而是重新表述问题。意识的本质、生命的起源、智能的边界——这些古老追问,在FEP框架中获得新的精确形式,等待新的答案

    下一章,我们将进入"活性算法"的整合——将FEP、UV自由、自适应临界性、多尺度复频率链,统合为理解生命的当代视角。但请记住这一章的教训:生命的奥秘可能不在于我们发现了什么,而在于我们如何推断;不在于世界的复杂性,而在于我们简化它的方式



https://blog.sciencenet.cn/blog-41701-1532490.html

上一篇:弗洛伊德的科学基础 第十章:弗洛伊德的未来——全息自我的科学
下一篇:自然哲学的历史 第1章 仰望星空的人——自然哲学的起源
收藏 IP: 111.25.142.*| 热度|

1 刘进平

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-28 11:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部