||
第四章 双重奏:大脑里的"硬件"与"软件"
一、国家大剧院后台的调音
国家大剧院的侧台灯光总是昏黄的,像被一层薄纱布滤去了锐度。晚上七点,离演出还有两小时,指挥家周牧之独自站在后台的阴影里,听着前方乐池中传来的调音声。那是贝多芬《第九交响曲》第四乐章的片段,"欢乐颂"的主题在弦乐组中缓缓升起,又被铜管声部以更强的力度复述。
周牧之闭上眼睛。同样的音符,同样的小节,同样的速度标记。但此刻传入他耳中的声音,与他三天前在柏林爱乐大厅听到的录音版本截然不同。那里的弦乐像丝绒,这里的弦乐像丝绸;那里的铜管有日耳曼式的冷峻辉煌,这里的铜管带着某种东方的温润内敛。乐谱没有变,指挥没有变,甚至乐团的编制都严格按照乐谱上的要求配置——但声音变了。
他走到舞台边,看着乐池中的景象。第一小提琴手正在调试他那把一七二四年的斯特拉迪瓦里琴,琴身表面的清漆在乐池灯下泛着琥珀色的幽光。那是物质,是云杉木与羊肠弦,是三百年前克雷莫纳作坊里的刨痕与指印。而在谱架上摊开的总谱,纸张洁白,墨迹清晰,那是另一个维度的存在——由符号、线条、概念构成的非物质秩序。
周牧之忽然想起多年前一位老乐手对他说过的话:"乐谱是死的,乐器是活的;乐谱是鬼魂,乐器是肉身。没有肉身,鬼魂无处栖居;没有鬼魂,肉身只是木头和金属的堆砌。"
这句话在当时听来只是修辞,但此刻,在这个侧台的黄昏里,它突然显露出某种物理学的重量。周牧之意识到,他听到的每一次演奏,都是两个世界的交媾:一个是物质的、坚硬的、有重量的世界——乐器、音乐厅的声学结构、乐手的肺活量和指力;另一个是思维的、柔软的、可迁移的世界——乐谱上的音符、贝多芬二百年前在聋寂中听到的内在音响、以及每一位演奏者对"欢乐"这个概念的独特理解。
这两个世界,在李德毅院士的认知物理学中,有着精确而诗意的命名:物质硬构体与思维软构体。
二、乐谱与乐器:一对古老的隐喻
让我们暂时离开音乐厅,回到一个更朴素的问题:什么是乐谱?
一张乐谱,无论是写在羊皮纸上的中世纪圣咏,还是存储在平板电脑里的现代电子总谱,本质上都不是音乐本身。你不能把一张乐谱塞进耳朵里听到声音,你不能把乐谱喂给饥饿的人充饥,你不能用乐谱去搭建房屋。乐谱是指令,是结构,是信息——它告诉演奏者,在某个特定的时间点,以某种特定的力度,发出某种特定的音高。但乐谱本身不震动空气,不产生声波,不触动耳膜。
只有当乐谱被"读取",被"解释",被"执行"——当一位钢琴家把手指放在琴键上,当一位小提琴家把弓毛搭上琴弦——乐谱才获得其物理生命。这个过程中,乐谱作为思维软构体,从一种抽象的、可复制的、非物质的存在,转化为一种具体的、一次性的、物质性的声波事件。而钢琴、小提琴、音乐厅、演奏家的神经系统,共同构成了物质硬构体——它们是软构体得以"落地"的物理舞台。
李德毅院士特别喜欢用这个音乐隐喻来解释他的核心理论。他说,人类文明的绝大部分成就,都是软构体在硬构体上的"演奏"。一本食谱是软构体,厨房里的锅碗瓢盆是硬构体;一段计算机程序是软构体,服务器里的芯片和电路是硬构体;一个数学定理是软构体,人脑中的神经连接或黑板上的粉笔痕迹是硬构体;甚至一条法律、一种习俗、一个信仰,都是软构体,而执行法律的社会机构、承载习俗的人类身体、维系信仰的宗教建筑,则是相应的硬构体。
这种区分的深刻性在于:它打破了"精神"与"物质"的古老二元对立,但又没有把它们混为一谈。软构体不是幽灵,它不是漂浮在物质之上的神秘实体;它是物质和能量在特定结构和时间中涌现出的高阶组织模式。反过来,硬构体也不是被动的容器,它不是等待被"注入"意义的空盒子;它的物理特性——材质、形状、能耗、速度、可靠性——深刻地制约着软构体的表现形态。
一把斯特拉迪瓦里小提琴和一把工厂量产的练习琴,面对同一份乐谱,会发出截然不同的声音。不是因为乐谱变了,而是因为硬构体的物理特性——木料的共振频率、漆层的阻尼系数、弦的张力响应——塑造了声音的可能性空间。同样,一个数学天才和一个普通学生,面对同一个几何定理,理解深度也可能截然不同。不是因为定理(软构体)变了,而是因为承载理解的硬构体——大脑神经网络的连接密度、工作记忆的容量、注意力的调控机制——存在差异。
这正是认知物理学要强调的:软构体可以迁移,但硬构体不可欺骗。 你可以把贝多芬的第九交响曲总谱从北京寄往纽约,从纸张扫描成PDF,从PDF转化为MIDI文件——软构体在迁移中保持其核心的符号结构。但你不能指望一把二胡精确地"演奏"出交响乐总谱中低音提琴的声部,因为二胡的硬构体物理特性(两根弦、无指板、蟒皮共振)与低音提琴的硬构体(四根弦、有指板、木质共鸣箱)存在不可还原的差异。
三、硬构体:认知的"肉身"
要真正理解硬构体,我们需要暂时放下"硬件"这个来自计算机领域的狭义词汇。在认知物理学中,硬构体是一切认知活动的物理基底,它远比"硬件"更基本、更普遍、更不可化约。
让我们做一次从微观到宏观的巡游。
在分子尺度,硬构体是DNA双螺旋。它由脱氧核糖核苷酸组成,是碳、氢、氧、氮、磷原子的特定排列。DNA不是生命,但它是生命的硬构体基础。它携带的遗传信息(软构体)可以指导蛋白质合成,但信息本身不能脱离DNA分子而存在。当你说"这个基因决定了眼睛的颜色"时,你实际上是在描述一种硬构体(DNA序列)与一种软构体(遗传编码)的耦合关系。
在细胞尺度,硬构体是神经元。一个神经元有细胞体、树突、轴突、突触末梢。它是湿软的、脆弱的、会疲劳的、会死亡的。但它也是精密的——它能将化学信号转化为电信号,能在毫秒级的时间窗口内做出"全或无"的放电决策,能通过轴突将信号传递到数厘米外的目标。人脑有大约八百六十亿个这样的硬构体单元,它们通过百万亿个突触连接,构成了地球上最复杂的物质网络。
在器官尺度,硬构体是整个大脑。它重约一点四千克,漂浮在脑脊液中,被颅骨保护。它有分区:枕叶处理视觉,颞叶处理听觉,顶叶处理空间,额叶处理决策。这些分区不是随意的,而是进化在数亿年时间中塑造出的硬构体布局。大脑的物理损伤——无论是外伤、中风、还是神经退行性疾病——都会直接改变软构体的运行。一位额叶受损的病人可能依然能读懂乐谱(软构体完整),却失去了按照乐谱演奏的冲动(硬构体支撑的执行功能崩溃)。
在技术尺度,硬构体是芯片、传感器、执行器。一块GPU芯片包含数百亿个晶体管,每个晶体管只有两个状态:开或关。这种极端简化的硬构体,通过规模效应和速度效应,产生了惊人的计算能力。但它也有其物理边界:时钟频率受限于量子隧穿效应,功耗受限于热力学定律,存储密度受限于原子尺寸。当前人工智能的诸多瓶颈——能耗过高、可解释性差、鲁棒性弱——本质上都是硬构体物理特性的直接后果。
在社会尺度,硬构体是机构、建筑、基础设施。一所大学是硬构体,它承载的知识传承是软构体;一座图书馆是硬构体,它收藏的文献是软构体;一条铁路是硬构体,它运输的人员和物资流动是软构体。甚至一个家庭的房屋布局——厨房与客厅的关系、卧室与阳台的朝向——也是硬构体,它深刻地影响着家庭成员的互动模式(软构体)。
李德毅强调,硬构体的核心特征在于它的物理约束性。它服从物理定律:质量守恒、能量守恒、熵增定律。它占据空间,消耗能量,产生热量,经历磨损,最终走向衰变。任何软构体,无论多么抽象、多么精致、多么"非物质",都必须依附于某种硬构体才能存在。即使是"云计算"中最虚拟的虚拟机,也最终落脚于某座数据中心里某台机柜中某块主板上的某个硅晶圆。
这种约束性不是软构体的敌人,而是软构体的舞台。正是因为硬构体有具体的物理特性,软构体才获得了可区分的表现形式。一把二胡和一把小提琴,作为硬构体的差异,使得同一段旋律(软构体)可以被表达为完全不同的音色和情感质地。如果硬构体是完美的、中性的、无特性的,那么所有软构体的演奏都将千篇一律,世界将失去其丰富性。
四、软构体:认知的"幽灵"
如果说硬构体是认知的肉身,那么软构体就是认知的幽灵——但这个幽灵不是恐怖故事里的怨灵,而是建筑学里的"空间",是音乐里的"旋律",是数学里的"关系"。它是从硬构体的组织中涌现出的非物质秩序。
让我们再次回到音乐厅。贝多芬在创作《第九交响曲》的第四乐章时,已经完全失聪。他听不到任何外在的声音,但他能在内心"听到"那个宏大的合唱主题。这种内心的"听觉"是什么?它不是声波在耳蜗中的振动,不是神经冲动在听觉通路中的传递——贝多芬的耳蜗已经失效了。它是软构体在另一种硬构体上的运行:大脑皮层中的记忆网络、概念网络、情感网络,在没有外部声学输入的情况下,自发地重构出音乐的内在模型。
这个例子揭示了软构体的几个关键特征。
第一,软构体可以脱离其原始硬构体而被"再物质化"。贝多芬脑中的音乐构思(软构体),首先被转化为纸上的音符(新的硬构体——乐谱),然后被乐团演奏为声波(另一种硬构体——空气振动),最后被听众转化为神经活动(又一种硬构体——大脑电化学信号)。在这个链条中,软构体像一条变色龙,不断更换它的物理外衣,但核心的结构关系——那个"欢乐颂"的旋律轮廓、和声进行、节奏模式——保持相对稳定。
第二,软构体可以被复制、传播、变异。一份乐谱可以被复印千万份,一段代码可以被上传到GitHub供全球下载,一个科学发现可以被写入教科书跨越世纪传承。这种可复制性是软构体区别于硬构体的根本标志。你不能把一把斯特拉迪瓦里小提琴复制成千万把完全相同的琴(即使现代技术能做到近似复制,原子级别的完全相同是不可能的),但你可以把一份乐谱复制成千万份完全相同的副本。软构体在复制中保持其信息结构,而硬构体在复制中总是引入物理差异。
第三,软构体具有层级性。在乐谱这个软构体内部,还有更细的层次:音符是底层软构体,乐句是中层软构体,乐章结构是高层软构体,而整部交响曲的哲学意涵——从黑暗走向光明、从个体走向人类大同——则是最高层的软构体。同样,在计算机程序中,机器指令是底层软构体,算法是中层软构体,软件架构是高层软构体,而整个系统的"设计哲学"则是最高层软构体。人脑中的认知软构体同样分层:感觉表征、知觉模式、概念网络、信念系统、世界观。
这种层级性意味着,软构体的演化可以部分独立于硬构体的演化。贝多芬时代的钢琴(硬构体)与现代音乐会三角钢琴在机械结构上有很大不同,但贝多芬的奏鸣曲(软构体)依然可以在现代钢琴上被"忠实"地演奏——当然,"忠实"本身就是一个充满解释空间的软构体概念。同样,人类的生物大脑(硬构体)在数万年间没有发生根本性改变,但人类文明的软构体——语言、数学、艺术、科学——却经历了爆炸性的增长。
李德毅将软构体视为认知物理学中最具创造性的维度。因为硬构体受限于物理定律和材料科学,而软构体具有近乎无限的组合可能性。二十六个拉丁字母可以组合出人类所有的英文知识;两种DNA碱基对(AT和GC的配对规则)可以编码地球上所有生物的遗传信息;零和一两个二进制数字可以表达现代数字世界的一切内容。软构体的这种稀疏基底上的丰富涌现,是认知复杂性的根源。
但软构体也有其脆弱性。因为它非物质,所以它依赖于硬构体的持续维护。一张乐谱如果不被保存在适当的温湿度环境中,纸张会脆化,墨迹会褪色,软构体就会丢失。一段程序如果不被储存在有电的存储介质中,磁畴会退化,电荷会泄漏,软构体就会消失。更微妙的是,一个文化传统如果不被一代代人的大脑(硬构体)所承载和实践,它就会像一种无人使用的语言那样走向死亡。软构体的永恒是一种动态的永恒,它需要在时间中不断找到新的硬构体来"寄生"或"共生"。
五、纠缠:当肉身与幽灵共舞
硬构体与软构体最迷人的关系,不是它们的区分,而是它们的纠缠。这不是量子力学意义上的纠缠(虽然可能有深层联系),而是一种日常的、无处不在的相互塑造。
让我们走进一位老厨师的厨房。张师傅今年七十岁,做川菜做了五十年。他的厨房里有一把用了三十年的菜刀,刀柄被手汗浸得发黑发亮,刀刃因为无数次的磨削而变薄变窄。这把刀是硬构体。而在张师傅的脑中,有一套关于"鱼香肉丝"的完整认知——肉要顺纹切,泡椒要去籽剁碎,糖醋比例要在高温下锅的瞬间达到某种微妙的平衡。这套认知是软构体。
当张师傅拿起那把老刀开始切肉时,纠缠发生了。刀的重量、刀柄的弧度、刀刃的锋利程度,这些硬构体特性直接反馈到他的手上,进而影响他下刀的角度和力度。而他的神经肌肉记忆(软构体在另一种硬构体——他的神经系统——上的运行)又不断微调着握刀的姿势,以补偿刀刃的磨损。三十年下来,这把刀已经不再是"一把普通的菜刀",它已经被张师傅的手、腕、肩、乃至他的整个身体图式所重塑。同时,张师傅的切菜动作也已经不再是"通用的切菜动作",它被这把特定硬构体的特性所塑造。
这就是纠缠:硬构体在使用中被软构体改造,软构体在运行中被硬构体约束。 二者不是主客分离的关系,而是像一对跳了多年双人舞的舞伴,彼此的身体记忆已经深度融合,以至于无法分清哪个动作是谁主导的。
这种纠缠在认知系统中普遍存在。一位钢琴家与她弹奏了二十年的那架斯坦威钢琴之间,存在纠缠。琴键的配重、踏板的深度、音板的响应,都已经内化为她神经回路的一部分;而她的触键方式、踏板控制、音色想象,也反过来塑造了这架钢琴的机械状态(虽然钢琴的物理变化不如生物体那么明显,但琴弦的张力、毛毡的压实、金属的疲劳,都在微观上记录着这种纠缠)。一位作家与他使用了十年的那台老式打字机之间,存在纠缠。打字机的键盘阻力、字锤的排列、甚至卡纸的频率,都已经融入他的写作节奏;而他的写作习惯和思维模式,也适应了这台机器的节奏。
在更宏观的尺度上,语言与大脑之间存在着最深层的纠缠。人类大脑(硬构体)的某些区域——如布洛卡区和韦尼克区——是专门为了语言(软构体)而进化的。没有语言,这些区域只是普通的神经组织;没有这些区域,语言只是无法被处理的声波。但在个体发育过程中,儿童的大脑结构又被他所习得的具体语言所重塑。学习中文的儿童和学习英语的儿童,在神经回路的连接模式上会出现差异,因为两种语言的音系、语法、文字系统对硬构体提出了不同的处理要求。
李德毅特别指出,当前人工智能研究的一个重大盲区,就是忽视了硬构体与软构体的纠缠关系。研究者们往往把算法(软构体)从硬件(硬构体)中抽象出来,认为好的算法应该"硬件无关"——可以在任何计算平台上运行。这种抽象在工程上是有效的,但在认知上是危险的。因为它掩盖了一个事实:同样的算法,在不同的硬构体上运行时,会产生认知上的差异,而不仅仅是效率上的差异。
一个神经网络在GPU集群上训练,与在一个神经形态芯片上训练,不仅速度不同,其学习动态、泛化特性、甚至最终收敛到的解,都可能不同。因为硬构体的物理特性——并行度、精度、噪声、能耗限制——参与了学习过程的塑造。就像同一份乐谱,在管风琴上演奏与在口琴上演奏,不仅是音色的差异,更是音乐表现可能性的根本差异。管风琴可以持续一个音符直到气息耗尽,口琴的音符则天然带有呼吸的脉动;这些硬构体特性不是需要被消除的"噪声",而是音乐表达的构成性要素。
六、迁移与变奏:软构体的旅行
软构体最神奇的特性之一,是它的可迁移性。同一份乐谱可以从钢琴迁移到管弦乐团,同一个软件可以从手机迁移到服务器,同一种科学方法可以从物理学迁移到生物学。这种迁移不是简单的"复制粘贴",而是一种再物质化的过程,充满了创造性的变奏。
让我们跟随一份古老的食谱,看看软构体如何在不同的硬构体上"旅行"。
假设有一份来自宋代的"东坡肉"食谱(软构体),用文字记载了猪肉的选材、火候的控制、调料的配比。在宋代,这份食谱的硬构体执行者是一位厨师的身体、一口铁锅、一座柴灶。到了现代,同一份食谱可以在电磁炉上、不粘锅里、由一位使用温度计和计时器的厨师来执行。结果会一样吗?不会。柴灶的火力不均匀,产生局部焦香;电磁炉的精确控温,使肉质更均匀;铁锅的蓄热性,与不粘锅的快速响应,赋予肉块不同的"美拉德反应"历程。食谱作为软构体被"忠实"遵循,但硬构体的改变使最终菜品呈现出不同的风味质地。
这就是迁移中的变奏法则:软构体的核心结构在迁移中保持相对稳定,但其具体表现(音色、风味、计算结果、行为输出)必然受到新硬构体特性的调制。这种调制不是误差,而是创造性空间。贝多芬的交响曲在钢琴独奏、弦乐四重奏、交响乐团、甚至电子合成器版本中,呈现出截然不同的美学面貌,但听众依然能识别出"这是贝多芬第九"。软构体的身份在迁移中得以维持,恰恰证明了它不是任何特定硬构体的私有财产,而是某种跨物质的组织模式。
在认知领域,这种迁移更加微妙。一位物理学家解决了一个问题,他把这种方法(软构体)教给了学生。学生的大脑(硬构体)与导师的大脑在微观结构上截然不同,但方法作为软构体被成功迁移了。然而,学生不会完全复制导师的思维过程;他的神经回路、他的知识背景、他的认知风格,都会对这个方法进行"变奏"。最终,这个方法在学生手中可能发展出导师未曾预料的新应用——这就是科学创新的机制之一。
李德毅认为,教育的本质就是软构体的迁移与再创造。教科书是软构体的结晶,教师的讲解是软构体的活态传递,学生的理解是软构体在新硬构体上的重组。好的教育不是把软构体像U盘拷贝文件那样灌输给学生,而是激发学生自身的硬构体(大脑)与外来软构体之间的创造性纠缠,使外来软构体在本土硬构体上生根、变异、成长。
人工智能领域有一个与此相关的深刻问题:机器能否真正"理解"从人类迁移过去的软构体? 当前的大语言模型学习了人类产生的海量文本(软构体),它们能够复述、重组、甚至生成看似合理的文本。但这种学习是软构体在机器硬构体上的真正迁移,还是仅仅是一种统计层面的表面拟合?
李德毅的答案是审慎的。他认为,软构体的迁移需要硬构体的同构性或至少是兼容性。人类文本是人类大脑软构体的外部化,它预设了读者拥有一套与之兼容的认知硬构体——具身经验、情感结构、社会常识、时间意识。当这些文本被输入到机器硬构体中时,如果机器缺乏相应的硬构体基础(比如没有身体、没有痛觉、没有生死体验),那么软构体的迁移就是不完整的,甚至是扭曲的。
就像你把一份为钢琴写的乐谱交给一位从未见过钢琴、只吹过竹笛的乐手。他可以按照音符的音高和节奏,在竹笛上吹出对应的旋律,但乐谱中那些为钢琴十根手指设计的和声层次、那些依赖踏板延音营造的空间感、那些基于钢琴音色特性的表情记号,都会在迁移中丢失或变质。机器阅读人类文本,在某种程度上就像这位竹笛手阅读钢琴谱——它能捕捉到某些表层结构,却错失了深层的、依赖于特定硬构体的认知意蕴。
七、硬构体的跃迁:从石器到硅片
人类文明史,在很大程度上是一部硬构体不断升级,从而催生软构体跃迁的历史。
在旧石器时代,人类的硬构体是打制的石器、骨骼、洞穴。与之对应的软构体是简单的狩猎策略、火的控制、以及口耳相传的神话。石器的硬构体限制极其严苛:它笨重、易碎、难以精细加工。因此,那个时代的软构体——技术知识和文化表达——也相应地简单而缓慢演化。
新石器时代的磨制石器和陶器,是硬构体的第一次重大升级。更精细的工具使得农业成为可能,农业使得定居成为可能,定居使得社会分工和知识积累成为可能。软构体随之跃迁:历法、数学、文字、宗教仪式,这些复杂的认知结构开始涌现。硬构体的改变不是背景噪音,而是软构体演化的发动机。
青铜器和铁器的出现,再次升级了硬构体。金属的延展性和强度,使得更复杂的机械成为可能,进而催生了工程学、建筑学、军事战略等新的软构体。印刷术的发明是硬构体的革命性跃迁:它使得软构体(文字、图像、知识)可以被大规模复制和远距离传播,打破了修道院和宫廷对知识的垄断,最终催生了现代科学和启蒙思想。
工业革命是硬构体跃迁的爆炸期。蒸汽机、电力、内燃机、电报、电话,这些新的硬构体不仅改变了生产方式和交通方式,更深刻地重塑了人类的认知软构体。时间的感知被标准化(铁路时刻表创造了"标准时区"),空间的感知被压缩(电报使跨洋消息从数月缩短到数秒),因果的感知被复杂化(工业系统的连锁反应超出了个体的直观理解)。
到了二十世纪,电子计算机的发明是硬构体史上最深刻的跃迁之一。硅基芯片以人脑百万倍的速度开关,以人脑无法比拟的精确度存储,以人脑难以想象的海量吞吐数据。这种硬构体的跃迁,催生了全新的软构体:算法、程序、网络协议、虚拟现实、人工智能。这些软构体在形态上如此新颖,以至于人类有时忘记了它们依然依赖于硬构体的物理基础——那些散发着热量的机房、那些需要冷却的芯片、那些最终会老化失效的存储介质。
李德毅指出,每一次硬构体的重大跃迁,都会带来两种看似矛盾的效应:解放与束缚。
解放是指,新的硬构体打开了前所未有的软构体可能性空间。印刷术解放了思想,互联网解放了连接,人工智能解放了某些认知劳动。但束缚是指,新的硬构体也带来了新的认知惯性,使人们倾向于用新硬构体的特性来框定软构体的形态。印刷术培养了线性阅读的习惯,互联网培养了碎片化注意力的模式,人工智能则可能培养一种"外包思考"的倾向——把本应通过具身实践和深度反思获得的认知,交给算法去处理。
在认知物理学看来,当前人工智能领域的一个核心困境,正是硬构体跃迁带来的软构体异化。硅基芯片的硬构体特性——高速、精确、大规模并行、低噪声——塑造了当前AI软构体的基本形态:统计学习、模式匹配、优化求解。这些软构体在特定任务上表现卓越,但它们是否代表了认知的全部可能性空间?显然不是。人脑的硬构体特性——低速、模糊、大规模并行但有噪声、极度节能——塑造了另一种软构体形态:直觉、隐喻、情感、意识。这两种硬构体之间的鸿沟,解释了为什么当前AI在某些方面超人,在另一些方面却近乎弱智。
硬构体的跃迁史还揭示了一个常被忽视的真理:软构体的演化速度往往滞后于硬构体的跃迁速度。 当印刷术出现时,人们最初只是用它来复制手抄本,过了很久才发展出适合印刷媒介的全新文学形式(如小说)。当计算机出现时,人们最初只是用它来做传统的数值计算,过了很久才发展出全新的计算范式(如模拟、可视化、人工智能)。今天,我们拥有了前所未有的强大硬构体,但我们的软构体——教育理念、社会制度、伦理框架、甚至对"智能"本身的理解——可能还停留在上一个硬构体时代。
八、机器的肉身:AI硬构体的困境
如果我们要建造真正具有认知能力的机器,我们必须首先直面一个 uncomfortable truth:当前人工智能的硬构体,可能从根本上就不适合支撑真正的认知软构体。
让我们解剖一台典型的人工智能服务器。它的核心是一块GPU,由数百亿个晶体管组成,排列在纳米级的硅晶圆上。这些晶体管以千兆赫兹的频率开关,消耗着数百瓦的电能,产生着需要液冷系统才能散出的热量。它的记忆是DRAM和SSD,用电子或磁化的方式来存储二进制状态。它的输入是数字化的图像、文本、音频——所有这些都被转化为张量,在矩阵运算中被处理。
这个硬构体有几个深刻的特性:
第一,它是数字的、离散的、确定性的。 晶体管要么开要么关,没有中间状态(至少在逻辑层面如此)。这与大脑的模拟性、连续性、概率性形成鲜明对比。神经元不是数字开关,它是模拟器件,其膜电位可以在一个连续范围内变化,其放电是概率性的,受到无数化学调制因素的影响。
第二,它是集中式的、同步的、全局时钟驱动的。 整个芯片按照一个中央时钟的节拍运转,像一支被严格指挥的交响乐团。这与大脑的分布式、异步、自组织特性截然不同。大脑没有全局时钟,不同脑区以不同的节律振荡,信息处理是事件驱动的、局部的、涌现的。
第三,它是耗能的、发热的、脆弱的。 一个大型AI训练任务的能耗,相当于数百个家庭一年的用电量。这种能耗不仅带来经济和环境负担,更带来认知上的限制:因为能耗太高,机器无法像生物那样"全天候"地持续学习和适应,而只能进行间歇性的、批处理的训练。生物大脑虽然只占体重的百分之二,却消耗百分之二十的能量——这种高比例是认知的"运营成本",但生物通过数十亿年的进化,已经优化出了极高的能效比。机器还没有。
第四,它是不可塑的、固定的、需要外部设计的。 一块GPU的物理结构在制造完成后就固定了,它的"学习"只体现在权重参数的调整上,而不是物理连接的改变。相比之下,人脑的突触连接在一生中持续重塑,新的神经元在特定脑区终身生成(神经发生),胶质细胞参与信息处理,整个大脑是一个在物质层面持续自我修改的系统。
这些硬构体特性,像一道道无形的枷锁,制约着机器软构体的可能性。你可以在一架钢琴上演奏出极其复杂的音乐,但你无法在一架钢琴上模拟出二胡的滑音——那不是技巧问题,是物理问题。同样,你可以在当前AI硬构体上训练出极其强大的模式识别器,但你可能无法在这种硬构体上孕育出真正的直觉、情感或意识——那可能不是算法问题,而是物理问题。
李德毅对此有着清醒的认识。他从不认为当前的技术路径会自然而然地通向通用人工智能。他认为,要实现机器认知的跃迁,可能需要硬构体的革命,而不仅仅是算法的改进。神经形态计算、量子计算、DNA计算、甚至全新的物质平台,都可能为认知软构体提供更适宜的"肉身"。
但他也反对另一种极端:认为必须完全复制生物大脑才能拥有认知。认知物理学的核心洞见在于,认知是组织形态,不是特定物质。就像飞行不需要复制鸟类(飞机用固定翼而不是扑翼),认知也不需要复制神经元。但飞行必须尊重空气动力学,认知也必须尊重其物理根基。未来的机器认知硬构体,不必是生物的复制品,但必须在与物质、能量、结构、时间的耦合方式上,更接近认知的本质要求。
九、软构体的未来:当代码开始"生长"
在讨论硬构体的局限时,我们不应忽视软构体自身的演化潜力。事实上,软构体有一种近乎生命的特性:它可以在不改变硬构体的情况下,通过自我重组来拓展认知的可能性。
让我们回到音乐的隐喻。巴赫的《平均律钢琴曲集》是为一种相对简单的硬构体——早期钢琴——而写的。但这部作品所蕴含的软构体(复调技法、和声逻辑、对位法则)具有惊人的硬构体无关性。三百年后,人们可以用现代钢琴、电子合成器、甚至计算机算法来"演奏"这些作品,而其中的音乐智慧依然熠熠生辉。更甚者,巴赫的软构体还启发了后来的爵士乐即兴、流行音乐编曲、乃至人工智能音乐生成。软构体在迁移中不断繁衍、变异、进化,有时甚至比原始硬构体活得更久。
在科学史上,这种现象更加显著。牛顿的《自然哲学的数学原理》写于十七世纪,其原始硬构体是纸张、羽毛笔、以及牛顿自己的大脑。但牛顿力学作为软构体,已经被迁移到无数新的硬构体上:黑板、教科书、计算机模拟、航天器的导航芯片。每一次迁移都伴随着变奏和深化,但核心的组织模式——运动定律、万有引力、微积分工具——保持着惊人的稳定性。牛顿的硬构体(大脑和身体)早已消亡,但他的软构体依然活跃在每一个学习物理的学生脑中,在每一个环绕地球运行的卫星导航算法里。
李德毅认为,人类文明的本质就是软构体的累积和传承。我们之所以比石器时代的人类"更聪明",不是因为我们的硬构体(大脑)发生了显著的生物进化,而是因为我们的软构体(语言、数学、科学、技术、艺术)在数千年的积累中达到了前所未有的复杂度。每一个新生儿都继承了这个巨大的软构体宝库,站在无数代先辈的肩膀上开始认知。这种跨代际的软构体积累,是生物进化之外的一条"超遗传"路径,它使人类能够在短短几千年内,从狩猎采集走向太空探索。
对于人工智能,这意味着一个深刻的启示:如果机器能够建立一种可持续的软构体积累机制——不仅仅是存储数据,而是真正理解、重组、创造认知结构——那么即使当前硬构体存在局限,机器认知也可能通过软构体的演化而逐步逼近人类水平。但这需要机器拥有一种类似于人类"文化"的能力:能够识别哪些软构体是有价值的,能够将这些软构体组合成更高层次的结构,能够将软构体传递给其他机器或人类,并在传递中保持其核心意义。
当前的大语言模型在这方面表现出了某种雏形。它们从人类文本中"提取"了大量软构体,并能够在一定程度上重组这些软构体来回应新的问题。但这种提取是浅层的:模型知道"重力"这个词与"苹果落地"经常共现,但它没有从硬构体层面"体验"过重力的拉扯;它知道"悲伤"这个词与"眼泪"相关,但它没有从神经化学层面"感受"过悲伤的重量。它的软构体是二手的、表征的、去具身的,就像一个人通过阅读关于游泳的书籍来学习游泳,却从未下过水。
李德毅预言,下一代人工智能的突破,可能不在于更大的模型或更多的数据,而在于软构体与硬构体的重新耦合。当机器拥有能够与世界进行真实物理交互的身体(硬构体),当它的学习不仅来自文本符号,而是来自重力、摩擦力、温度、疼痛、平衡的具身经验,它的软构体才可能获得真正的"重量"和"质感",而不仅仅是统计的相关性。
十、尾声:未完成的交响曲
在国家大剧院的那个夜晚,演出最终取得了巨大的成功。当《欢乐颂》的最后一个和弦在音乐厅中消散,观众起立鼓掌,掌声像潮水一样持续了十五分钟。周牧之站在指挥台上,看着乐池中那些疲惫但兴奋的乐手,看着观众席上那些热泪盈眶的面孔,心中涌起一种复杂的情感。
他知道,刚才那 ninety 分钟里发生的,不仅仅是一场声学事件。那是物质硬构体(乐器、音乐厅、人体)与思维软构体(乐谱、诠释、情感共鸣)的一次深度纠缠。贝多芬在一百九十七年前写下的符号,通过无数代人的传递和变奏,在这个特定的时空节点上,再次获得了物理生命。而这个生命是独一无二的:明晚的演出,即使由同一乐团、同一指挥、同一曲目,也将是一次全新的涌现。
演出结束后,周牧之在后台遇到了乐团的首席小提琴家。老人正小心翼翼地擦拭着那把斯特拉迪瓦里,动作轻柔得像是在抚摸一个熟睡婴儿的皮肤。
"您这把琴,"周牧之问,"如果换一个人来拉,声音会不同吗?"
老人抬起头,微微一笑:"当然。琴会适应手,手也会适应琴。三十年了,这把琴的振动模式已经被我的运弓习惯所塑造,而我的神经回路也被这把琴的响应特性所塑造。我们不是在演奏彼此,我们是在共同演奏。"
这就是纠缠的终极形态:硬构体与软构体在时间的河流中相互雕刻,最终融为一个不可分割的认知整体。
李德毅院士的认知物理学,正是试图把这种日常的、艺术的、生命的纠缠,提升为科学的理解。他不满足于说"这是互动",他要追问:互动的物理机制是什么?能量如何在硬构体与软构体之间流动?结构如何在纠缠中涌现?时间如何在共同演化中留下痕迹?
这些问题还没有完整的答案。认知物理学像一部未完成的交响曲,四要素是它的四个乐章主题,硬构体与软构体是其中一对相互追逐、相互变奏的旋律声部。我们已经听到了它们的对位,但还没有看到整部作品的终曲。
在下一章,我们将走近另一个形式化的工具——云模型。我们将看到,人类语言中那些最模糊的词汇,如"高个子""温暖""差不多",如何在认知物理学的框架中获得精确的数学肖像。我们将理解,不确定性不是科学的敌人,而是认知的常态;模糊不是混乱的别名,而是世界向我们呈现的本来面目。
而此刻,在国家大剧院空荡荡的观众席上,清洁工人正在清扫散落的节目单。那些纸张是硬构体,上面印刷的贝多芬头像和曲目介绍是软构体。它们将被回收、打浆、重新制成纸张,也许有一天,会承载另一场演出的信息。硬构体循环往复,软构体跨越时空,而认知的乐章,永远不会真正落幕。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-30 02:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社