||
第八章 薛定谔的密码
一、都柏林的邀请
1943年2月,都柏林三一学院的小讲堂里坐满了听众。他们中有物理学家、化学家、生物学家,也有哲学家和公众。讲台上,一位56岁的奥地利学者正在发表系列演讲。他的主题是:"生命是什么?——活细胞的物理面貌"。
埃尔温·薛定谔(Erwin Schrödinger,1887-1961年)是量子力学的奠基人之一,波动力学的创立者,1933年诺贝尔物理学奖得主。他为何转向生物学?这既是个人命运的转折,也是时代精神的体现。
薛定谔的流亡生涯始于1933年。作为反对纳粹的奥地利人,他先后离开柏林、牛津,最终在1940年定居都柏林。爱尔兰总理埃蒙·德·瓦莱拉邀请他建立高级研究院(Institute for Advanced Studies),希望复制普林斯顿的成功。薛定谔接受了,但条件是可以研究任何感兴趣的领域。
他的兴趣转向了生命。这不是突发奇想:薛定谔的父亲是植物学家,他从小熟悉生物学;他与马克斯·德尔布吕克(Max Delbrück)等生物物理学家有交流;更重要的是,他看到了物理学与生物学的深层联系——量子力学的不确定性、统计规律、信息概念,可能解释生命的独特性质。
《生命是什么?》(What is Life?)于1944年出版,基于都柏林的演讲。这本书只有90页,却成为20世纪最有影响的科学著作之一。它启发了克里克和沃森转向DNA研究,启发了威尔金斯学习物理学,启发了整整一代科学家用新的眼光看待生命。
但薛定谔的论点在今天看来部分错误、部分过时。为何它仍有价值?因为薛定谔提出了正确的问题,即使他的答案不完全正确。
二、秩序的秩序
薛定谔的核心问题:生命如何维持其高度有序的组织,对抗热力学第二定律?
热力学第二定律说:孤立系统的熵(无序度)总是增加。但生命体是高度有序的:精确的细胞结构、复杂的代谢网络、准确的信息传递。生命似乎"违反"了热力学第二定律。
薛定谔的回答是:生命以负熵为食(It feeds on negative entropy)。生命体通过从环境中汲取秩序(低熵的能量,如阳光或食物),排出无序(高熵的废物,如热和二氧化碳),从而维持和增加自身的组织。
这个表述是启发性的,但不精确。后来的热力学(特别是非平衡热力学)表明,生命不是"以负熵为食",而是耗散结构(dissipative structure):在能量流动的条件下,开放系统可以自发形成和维持有序结构。熵在系统内部产生,但通过能量输入和物质交换被排出,系统的总熵(系统+环境)仍然增加。
但薛定谔的直觉是正确的:生命是秩序的生产者,而这种生产需要能量流动。 他将生命置于热力学的框架中,不是作为神秘的例外,而是作为物理学的延伸。
更深远的影响是"秩序来自秩序"(order from order)的概念。薛定谔区分了两种秩序:
"来自无序的秩序":统计规律,如气体分子的平均行为;
"来自秩序的秩序":确定性规律,如晶体结构或遗传机制。
生命属于第二种:遗传信息从一代传递到下一代,保持高度的精确性。 这种精确性不能是统计的(如经典物理学的平均行为),必须是量子力学的——基于离散的状态,而非连续的分布。
三、基因作为密码
薛定谔对遗传机制的推测是革命性的。1944年,DNA作为遗传物质刚刚被证实(埃弗里的实验),其结构未知,基因的本质仍是谜。
薛定谔提出:基因是一种"非周期性晶体"(aperiodic crystal)。周期性晶体(如盐或钻石)的结构是重复的、单调的,只能编码有限的信息。非周期性晶体的结构是复杂的、独特的,可以编码几乎无限的信息。
"非周期性晶体"这个术语今天不再使用,但其精神被DNA双螺旋完美实现:四种碱基的序列是非周期的,可以编码蛋白质的信息。薛定谔预见了信息存储的分子基础,虽然他没有猜到具体的化学。
更重要的是,薛定谔将基因视为"密码脚本"(code-script):"微型密码应该对应于一个高度复杂的特定发育计划,并包含了使密码起作用的程序。" 这是"遗传密码"概念的首次明确提出——基因不仅是物理结构,也是信息载体。
薛定谔还讨论了突变的量子力学基础。经典物理学中,突变(性状的突然改变)难以解释:如果遗传是连续的,微小的变化应该产生微小的效应。但量子力学提供了"量子跃迁"的模型:分子从一种稳定状态跳到另一种,无需经过中间状态。这解释了突变的离散性和突然性。
德尔布吕克(当时还在哥本哈根与玻尔工作)提出了更具体的模型:基因是分子,突变是分子的同分异构转变。这个模型后来被证明过于简化(突变是DNA序列的改变,不一定是同分异构),但它启发了"噬菌体小组"(Phage Group)的研究——用物理学方法研究遗传。
四、信息论的兴起
薛定谔的"密码"隐喻不是孤立的。1940年代,信息论(Information Theory)作为独立的学科诞生,彻底改变了通信、计算和生命科学的语言。
克劳德·香农(Claude Shannon,1916-2001年)在贝尔实验室工作,研究通信的效率和可靠性。1948年,他发表了《通信的数学理论》,奠定了信息论的基础。
香农的定义是操作性的:信息是不确定性的减少。如果一个事件是确定的(概率=1),传达它没有信息;如果一个事件是随机的(概率=0.5),传达它提供最大信息(1比特)。信息的单位比特(bit)是二进制的:是/否,0/1,开/关。
香农的公式H = -Σ p_i log p_i(熵的公式,与统计力学的熵形式相同)量化了信息的平均量。这揭示了信息与熵的深刻联系:信息是负熵,是秩序的度量。
香农的理论最初用于电信:如何编码信息以最大化信道容量,如何纠错以保证可靠性。但它很快被应用到生物学:
遗传信息:DNA序列的比特数(人类基因组约60亿比特,可压缩到约1亿比特);
神经编码:神经元发放的模式携带多少信息;
生态信息:动物的行为信号如何编码环境信息。
诺伯特·维纳(Norbert Wiener,1894-1964年)在同期发展了控制论(Cybernetics)。1948年的《控制论:或关于在动物和机器中控制和通信的科学》提出了反馈的概念:系统的输出作为输入影响系统本身,形成闭环控制。
反馈是生命的核心机制:体温调节(太热出汗,太冷发抖)、血糖调节(胰岛素和胰高血糖素)、血压调节(压力感受器反射)——都是负反馈的例子。正反馈(输出增强输入)也存在:血液凝固、动作电位的产生、群体行为的爆发。
维纳的控制论是跨学科的:它适用于机器(恒温器、自动驾驶仪),也适用于生物(稳态、反射、行为)。这延续了笛卡尔的"动物机器"传统,但用通信和控制取代了纯粹的机械。
五、分子生物学的诞生
薛定谔的信息论视角、香农的通信理论、维纳的控制论,共同塑造了分子生物学的诞生。这不是简单的"应用",而是概念框架的转换:生命被视为信息处理系统。
噬菌体小组(Phage Group)是这一转型的先锋。1940年代,马克斯·德尔布吕克、萨尔瓦多·卢里亚(Salvador Luria)、阿尔弗雷德·赫希等人在冷泉港实验室研究噬菌体(感染细菌的病毒)。他们选择噬菌体,因为它是最简单的遗传系统:只有DNA(或RNA)和蛋白质外壳,没有代谢,没有生长,只有感染和复制。
噬菌体研究的方法是物理学的:精确测量、定量分析、遗传杂交。1952年的赫希-蔡斯实验(证明DNA是遗传物质)是这一传统的顶峰。但更重要的是概念的创新:噬菌体的研究将基因从抽象的遗传单位,转化为可操作的物理实体——可以分离、标记、注射、重组。
细菌遗传学的兴起同样重要。约书亚·莱德伯格(Joshua Lederberg)和爱德华·塔特姆在1946年发现了细菌的接合(有性生殖),证明细菌也有遗传重组。这打破了"细菌没有遗传学"的偏见,为后来的大肠杆菌(E. coli)研究铺平道路。
DNA双螺旋(1953年)是信息论视角的物理实现。沃森和克里克在论文结尾写道:"我们注意到,我们假设的特定配对(碱基配对)立即提示了遗传物质的复制机制。" 这种模板复制是信息的保存和传递:序列信息从旧链复制到新链,误差极小(约10^-9每碱基每代)。
中心法则(Crick,1958年)形式化了信息流:DNA → RNA → 蛋白质。这是单向的、不可逆的(在当时认为),从稳定存储到功能执行。中心法则确立了信息的等级:DNA是"蓝图",RNA是"信使",蛋白质是"机器"。
六、密码的破译
1953-1966年,分子生物学的主要任务是破译遗传密码:DNA的碱基序列如何决定蛋白质的氨基酸序列?
乔治·伽莫夫(George Gamow,1904-1968年),物理学家和宇宙学家,在1954年提出了"钻石密码"模型。他注意到,DNA双螺旋的沟槽可以容纳氨基酸,特定的碱基组合对应特定的氨基酸。这个模型是错误的(密码不是基于空间匹配),但它启发了密码问题的数学化:需要多少碱基编码一个氨基酸?
4种碱基(A、T、G、C),如果1个碱基编码1个氨基酸,只有4种可能,不够20种氨基酸;2个碱基,16种可能,仍然不够;3个碱基,64种可能,足够且有冗余。伽莫夫预测了三联体密码(triplet code)。
马歇尔·尼伦伯格(Marshall Nirenberg,1927-2010年)和海因里希·马太(Heinrich Matthaei)在1961年取得了突破。他们使用无细胞系统(破碎的大肠杆菌细胞,保留蛋白质合成能力),加入合成的多聚尿苷酸(poly-U,即UUUUU...),发现只合成苯丙氨酸。因此,UUU编码苯丙氨酸——第一个密码子被破解。
随后的几年,所有64个密码子被确定。遗传密码表(genetic code)是简并的(degenerate):大多数氨基酸由多个密码子编码(如亮氨酸有6个密码子)。这种冗余提供了容错性:突变可能不改变氨基酸(同义突变),或改变为性质相似的氨基酸(保守突变)。
最令人惊讶的是密码的通用性:从细菌到人类,从线粒体到叶绿体,几乎使用同一套密码。这证明了生命的共同起源,也支持了水平基因转移(某些生物的密码有轻微修改,可能是从共生或病毒获得)。
密码的破译是信息论的胜利:生命使用数字编码(4种碱基,类似二进制的0/1),分组传输(3个一组),冗余校验(简并性),起始和终止信号(AUG起始,UAA/UAG/UGA终止)。这是工程学的最优设计,虽然它是自然选择的结果,而非工程师的意图。
七、从信息到计算
遗传密码的破译开启了分子生物学黄金时代,但也提出了新问题:信息如何被处理?基因如何被调控?发育如何被编程?
操纵子模型(Jacob & Monod,1961年)是第一步。他们研究了大肠杆菌的乳糖代谢,发现基因不是始终活跃,而是受调控蛋白控制:阻遏蛋白结合DNA的操纵基因(operator),阻止转录;诱导物(乳糖)结合阻遏蛋白,使其释放,基因表达。这是开关逻辑:开/关,0/1,布尔代数在分子层面的实现。
操纵子模型是反馈控制的分子版本:代谢物(乳糖)调节其自身代谢基因的表达。这展示了基因调控网络的可能性:基因产物调控其他基因,形成复杂的电路。
发育生物学的信息论转向同样重要。康拉德·沃丁顿(Conrad Waddington,1905-1975年)在1950年代提出了"表观遗传景观"(epigenetic landscape):发育不是基因到性状的线性映射,而是细胞在景观中的路径选择。景观的地形(坡度、山谷、分水岭)由基因决定,但具体路径受随机性和环境影响。
沃丁顿的景观是信息论的隐喻:发育是计算,基因是约束,细胞状态是变量。这种视角在1980-90年代被动态系统理论形式化,在21世纪被单细胞测序技术验证。
神经科学的信息论转向更为直接。香农的信息论被应用于神经编码:单个神经元的发放率携带多少信息?神经元群体如何编码刺激特征?霍勒斯·巴洛(Horace Barlow)提出了"有效编码"假说:神经系统进化来减少冗余,提取统计规律,类似于数据压缩。
感知作为推断的观念也在形成。亥姆霍兹(Hermann von Helmholtz)在19世纪提出"无意识推断":感知不是被动的接收,而是主动的假设生成。这一观念在20世纪被贝叶斯框架形式化:大脑根据先验知识和感觉证据,计算后验概率,形成对世界的最佳猜测。
八、量子生物学的萌芽
薛定谔的量子力学视角,在1960-70年代似乎被遗忘了。分子生物学的成功是经典化学的成功:DNA的氢键、蛋白质的疏水作用、酶的催化机制,都可以用经典物理化学解释。量子效应被认为是无关的:生物系统太热、太湿、太混乱,量子相干性会被立即破坏。
但1980年代后,量子生物学重新兴起。研究发现,某些生物过程可能利用量子效应:
光合作用的能量传输:在光合细菌中,光能被天线蛋白吸收,传递到反应中心。经典理论预测能量会随机游走,效率低下。但实验表明,能量传输是量子相干的:激子(电子-空穴对)以波的形式同时探索多条路径,找到最优路径。这种量子漫步(quantum walk)的效率接近100%。
鸟类的磁感应:候鸟利用地球磁场导航。研究发现,鸟类的视网膜含有隐花色素(cryptochrome),这种蛋白在光激发下形成自由基对,其自旋状态受磁场影响。自由基对的量子纠缠可能放大磁场的微弱信号,使鸟类能够感知方向。
酶的量子隧穿:酶催化反应中,质子或电子可以通过量子隧穿穿过势垒,加速反应。这不仅是"利用"量子效应,而是进化优化的结果:酶的构象波动与隧穿共振,实现动力学控制。
嗅觉的量子理论:传统理论认为,嗅觉受体通过形状匹配识别气味分子。但卢卡·图林(Luca Turin)提出振动理论:受体通过电子隧穿检测分子的振动频率。这个理论有争议,但实验证据在积累。
这些发现并不否定经典生物化学的主导地位,但它们表明:在特定条件下,生命可能进化出利用量子效应的机制。 这与薛定谔的直觉呼应:生命不是经典热力学的简单延伸,而是在量子-经典边界上运作。
九、信息论的生命观:评估
回顾20世纪上半叶的信息论转向,需要区分启发性的成功和概念的局限。
成功的方面:
分子基础的确立:信息论视角引导了DNA结构的发现、遗传密码的破译、基因调控的研究。没有"密码"的隐喻,这些进展难以想象。
统一的语言:信息、编码、信号、噪声、反馈、控制——这些概念适用于所有生命层次,从分子到生态系统,从基因到大脑。它们提供了跨学科的通用语。
技术的转化:分子生物学的信息论基础,直接催生了基因工程、DNA测序、合成生物学。生命成为可编程的、可设计的。
局限的方面:
基因中心论:信息论强调存储和传递,导致DNA被视为"蓝图"或"程序",忽视了发育的可塑性、环境的诱导、表观遗传的作用。基因是必要但不充分的。
静态的视角:信息论关注状态(编码了什么),忽视过程(如何生成、如何维持、如何演化)。生命是动态的、历史的、开放的,而非静态的、给定的、封闭的。
计算的隐喻:"大脑是计算机"、"细胞是机器"的隐喻,虽然启发性,但也遮蔽了生命的独特性:意识的质性(qualia)、生命的目的性、进化的创造性。
意义的缺失:香农的信息是语法的(符号的统计),而非语义的(符号的意义)。DNA序列的"意义"在于功能,而功能依赖于语境(细胞环境、发育阶段、生态位)。纯粹的信息论无法捕捉这种语境依赖性。
这些局限在20世纪后半叶引发了复杂性科学和系统生物学的兴起,将在下一章讨论。但信息论的遗产是持久的:生命作为信息处理系统的视角,仍然是现代生物学的核心,也是"活性算法"概念的前身。
十、从密码到算法
薛定谔在《生命是什么?》的结尾,转向了一个更深层的问题:意识与物质的关系。他承认,物理学和化学可以解释生命的"机制",但意识——"我"的感觉、主观体验、自由意志——似乎超出了科学的范围。
"意识与物质的关系,是真正的难题。" 薛定谔写道。他倾向于一元论的解决:意识和物质是同一实在的不同方面,类似于量子力学的波粒二象性。这种"东方"的解决(薛定谔深受印度吠檀多哲学影响)在当时是边缘的,但在21世纪的意识研究中重新浮现。
从"活性算法"的视角,薛定谔的遗产可以这样总结:
生命的物理基础:生命不违反物理学,但利用物理学的特定方面(非平衡热力学、量子效应)。
信息的中心性:生命是信息的保存、传递和处理,这种信息是物理的(编码在分子结构中),而非抽象的。
推断的动态性:生命体是"推断机器",根据有限的信息生成对世界的假设,并通过行动验证这些假设。这是贝叶斯推断的物理实现。
多层的时间尺度:从量子相干(飞秒)到分子振动(皮秒),到代谢反应(毫秒),到神经发放(毫秒),到行为(秒),到发育(天),到进化(百万年)——生命在不同时间尺度上运作,信息在不同尺度间流动。
自指的奥秘:生命体能够表征自身,形成"自我"的概念。这是意识的基础,也是"活性算法"试图解释的核心。
薛定谔没有活到看到分子生物学的全盛时期(他于1961年去世),但他的问题仍然开放:生命是什么? 从"非周期性晶体"到"遗传密码",从"负熵"到"信息",答案在不断演化。下一章,我们将进入20世纪后半叶的复杂性觉醒——当还原论遇到整体论,当信息论遇到系统论,生命被重新理解为涌现的、自组织的、历史的过程。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-13 12:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社