mbchen的个人博客分享 http://blog.sciencenet.cn/u/mbchen

博文

[转载]关于能量最低原理的误读——论“凭什么相信计算”之二(全文)

已有 8260 次阅读 2018-6-21 19:41 |系统分类:观点评述| 能量最低原理, 最大熵原理, 电子填充规则, 热力学

【两年前曾经写过,但这次把全文补上。】


原载:化学通报, 2015, 78: 868   .

关于能量最低原理的误读

——论“凭什么相信计算”之二

陈敏伯

(中国科学院上海有机化学研究所  上海  200032)


摘 要  不要把能量最低原理与核外电子填充规则混为一谈,后者仅仅是能量最低原理众多应用中的一例。体系“能量越低越稳定”的说法错在忘了它成立的前提:熵固定。Gibbs的说法才是能量最低原理的完整表述,它等价于Clausius的最大熵原理,两者各自有其成立的前提条件。由Gibbs能量最低原理可以导出核外电子的填充规则。宏观和微观世界只有一个能量最低原理。

关键词  能量最低原理,最大熵原理,电子填充规则,热力学


    这个题目会令人诧异:最低能量原理是化学界最耳熟能详又最基本的原理,怎么还会误读呢?的确,能量和熵是物理学、化学中最基础的两个概念,可以说那是我们头脑中业已建立起来的知识大厦的奠基石。对最低能量原理这样的大原则倘若理解有问题,那就无法进一步讨论“凭什么相信计算”的问题。


§1  很多人以为的“能量最低原理”

    学化学总是先从原子结构学起,理科化学系学生最早接受能量最低原理是在本科一年级学习多电子原子的核外电子排布的时候。从一年级的无机化学,到后来的结构化学,几乎所有的教科书、文献都这样说:“原子总是尽可能处于能量最低的状态。” [1]。“原子的核外电子排布遵循下面3个原则:(1)Pauli(不相容)原理……。(2)能量最低原理——在不违背Pauli原理的条件下,电子优先占据能量较低的原子轨道,使整个原子体系能量处于最低,这样的状态是原子的基态。(3)Hund规则……。”[2-5]。

    直到化学系研究生课程,还是这么教,“能量越低越稳定”一说就明白,国内外都一样。久而久之,很多人以为能量最低原理就是核外电子填充规则,(Aufbau principle 或 building-up principle)[3]。需要说明:本文对电子填充规则的关心不是在原子中电子轨道能量高低顺序的问题,而是要提醒读者在填充电子时运用的能量最低原理不是该原理的完整表述。

    不幸的是,正因为很多化学家把能量最低原理误以为就是核外电子填充规则,于是,实践中经常遇到困难,由此频频提出质疑,以为能量最低原理有局限性。有人说:“应该了解能量最低原理在有机化学理论解释中的局限(性),避免将能量最低原理当成万金油来滥用”[4]。近来,更有一本颇得好评的物理化学教科书专门有一节讨论“能量最低原理的局限性”。认为:“只有在基本能隙远远大于kBT时,能量最低原理才能使用”。结论是:“最低能量原理可能是对年轻化学家毒害最深的一个并不基本的概念。”[5]

    本着化学家再也不能容忍我们赖以思考的依据都来自有局限性的“原理”的观点,我赞赏以上质疑。尽管以上质疑把问题的源头搞错了,但这些质疑足以提醒人们问题是存在的。岂但存在,此类模棱两可、不堪一问且广为传播的化学原理实在太多,需要逐个正本清源。本文希望在重温能量最低原理的基础上,表达以下观点:

1)核外电子填充规则不是能量最低原理的完整表述,它仅仅是能量最低原理的众多应用实例之一。换言之,不能把核外电子填充规则误以为就是能量最低原理本身。

2)Gibbs的说法才是能量最低原理的完整表述[6,7]。能量最低原理是有其前提条件的。“能量越低越稳定”的说法不讲前提条件,当然会在应用中造成错误。

3)也不要误以为物质的宏观世界和微观世界分别遵守两个原理:宏观世界用最大熵原理,微观世界用能量最低原理,各自为“政”,没有联系。正如李政道先生所说:“物理学只有一个”[8],化学作为分子和分子聚集体层次上的物理学也只有一个。宏观和微观世界更只有一个能量最低原理。

    以下先介绍能量最低原理的Gibbs说法,然后将此应用到多电子原子的结构问题,结果将推导出核外电子填充规则。


§2  Gibbs的能量最低原理

    Clausius在1865年提出的最大熵原理(亦称熵增加原理)和Gibbs的能量最低原理都是热力学中的基本原理。它们都是在第二类永动机不可能成功的实验事实的基础上提出的,从而它们都是热力学的原理,即宏观世界的原理[6,7]。

    Clausius的最大熵原理,也就是热力学第二定律,可完整表述为:对于孤立体系(即能量U、体积V和粒子数N固定的体系),体系会在其他未受约束的内部状态变量的驱使下趋于平衡,在趋向平衡的过程中体系的熵S不断增大,到达平衡态时熵将达到极大值[6,7]。(注:在本文讨论的范围内,能量U就是内能。)

    与此对应,Gibbs对能量最低原理的表述为:熵S、体积V和粒子数N固定的体系,体系会在其他未受约束的内部状态变量的驱使下趋于平衡,在趋向平衡的过程中体系能量U不断降低,到达平衡态时能量将达到极小值。[6,7]

    物理学家L. Tisza和H.B. Callen曾经分别从两个不同角度证明最大熵原理与能量最低原理是严格等价的[6,7]。具体的证明可参见笔者在本刊去年第5期介绍热力学公理结构的文章[9]。

    最大熵原理提供了判断不可逆过程方向(即体系自发变化的方向,也就是宏观体系趋向稳定的方向)的普遍准则。它的实验基础是第二类永动机不可能成功的事实。既然,Gibbs的能量最低原理与最大熵原理等价,那么能量最低原理也是判断不可逆过程方向或稳定性的普遍准则,它的实验基础也是第二类永动机不可能成功的事实。只不过两个原理各有自己成立的前提。最大熵原理的前提是体系的U,V,N不变,而能量最低原理的前提是体系的S,V,N不变。不讲前提(即约束条件)的最低能量原理是不存在的。至此,读者已经可以看出不讲前提的“能量越低越稳定”肯定是错误的。

    事实上,对于封闭体系(即与环境没有物质交换、但可能有能量交换的体系)还有很多个判断不可逆过程方向的普遍准则(见表1),可以严格证明它们(包括最大熵原理和能量最低原理)互相等价,只是前提不同,即固定的宏观状态变量不同(文献[7]的第5、6章)。对于开放体系,还有巨势最低原理(dWG)T,V,m  0,其中巨势

WG ≡U-TS-μN

§3  从能量最低原理导出电子填充规则

    有人认为:上述热力学处理的是宏观体系,而核外电子的分布属于微观体系;宏观问题用最大熵原理,微观问题用能量最低原理,两者各管一段。这种把问题归结为微观和宏观的差别,以为把问题推给哲学就了事了。其实,这样做问题丝毫没有解决。割裂了宏观与微观的联系,也就无法回答一连串的问题,例如为什么微观体系应该用能量最低原理,而不是最大熵原理?能量最低原理到底是宏观规律还是微观规律?

    微观体系和宏观体系的差别在哪里?那只能到沟通微观和宏观的物理原理中去找,即到统计力学中去找。两种体系的差别在于涉及的微观状态(即量子态)的总数W不同。两者之间的联系靠Boltzmann关于平衡态的熵公式

S = kB ln W,                                            (1)

其中kB为Boltzmann常数。

    讨论微观体系时,只是关注体系所处的一个微观状态。就如核外电子的填充问题是讨论核外电子的构型(configuration)。譬如当铍原子核外的电子填到[He]2s1构型之后,下一个电子是填入2s还是2p?或者,铍原子核外的电子构型是[He]2s2稳定还是[He]2s12p1稳定?一个电子构型是一个量子态【注:为简便计权且如此,不影响本文讨论结论】。

    对于宏观体系,它的一个宏观状态涉及的量子态大约在NAv的数量级,其中NAv为Avogadro常数。宏观体系涉及的量子态的个数

一个巨大无比的数字。但根据式(1),可见宏观体系熵S ≠ 0,也就是若要使得接受比较稳定性的两个宏观体系的熵维持相同,相当于使它们涉及的量子态总数W相同,那并不容易做到。反之,使两个不同的宏观体系在实验中都保持为孤立体系倒是容易做到的。因此对于宏观体系经常采用最大熵原理来比较它们的稳定性,即比较哪个方向是自发变化的方向。

    这里出现了新问题:如何用属于宏观规律的能量最低原理来比较属于微观体系的两个电子构型稳定性呢?我们的说理体系中还没有现成的定律可以直接用到微观世界去。但是间接的办法还是有的:可以采用把微观体系构建成宏观体系的办法。例如将两个电子构型分别构建成两个理想晶体的办法,即用NAv个全部处于电子构型1状态的相同原子构建成理想晶体1。同样用NAv个全部处于电子构型2状态的相同原子构建成理想晶体2,设定两个晶体的几何结构完全相同(见图1)。因为后者属于宏观体系,于是就可以运用能量最低原理来比较这两个理想晶体的稳定性。

    晶体是定域子体系,每个晶格处原子的微观状态数Wi = 1。显然两个理想晶体的微观状态数相等,分别为

于是,根据式(1),两个理想晶体的熵相同,均为S = kB ln WXtal = 0。满足S,V,N不变的前提,所以应该用能量最低原理(而不该用最大熵原理)来比较这两个理想晶体的稳定性。再从宏观进到微观,判断两个电子构型的稳定性。

    有可能所有的微观体系不都能构建成理想晶体,但是总能构建成基态有简并度的晶体体系。只要比较的两个晶体体系结构相同就行。虽然,此时晶体的残余熵不为零,即微观状态数WXtal ≠ 1,但它肯定是一个确定的、相同的数。还能满足熵相同的前提。同样可以且应该用能量最低原理。又容易看出晶体的最低能量对应着其中单个原子的最低能量,也就是电子构型的最低能量。

    以上,我们已经从Gibbs的能量最低原理出发,从宏观到微观运用到核外电子填充的实例中,导出电子填充规则的确应该是按照电子构型的能量由低到高依次填入,微观能量低的对应着稳定的(即宏观能量也低的)宏观体系。能量本无微观、宏观之分,这里只是权且借此表明思路出入宏观、微观的轨迹而已。

    总之,Gibbs的说法才是能量最低原理的完整表述。核外电子填充规则仅仅是能量最低原理的众多应用实例中的一个。不能把核外电子填充规则误以为就是能量最低原理本身。

    另外,根据同样的道理,也能自然地看到:在量子力学中应该用的是能量最低的变分原理,比较态与态的关系,由此寻找基态的能量和态矢。同样,在电子密度泛函理论中,在电子数N一定的约束条件下,也是用能量最低的变分原理,来寻找基态的电子密度ρ(r)(文献[10]的16.1节)。其理由是它们都可看做熵为零(即微观状态数为1)或绝对零度的情况。

    当然,微观世界的问题并不都是绝对零度下的问题。在需要考虑温度的场合,就要从普通的量子力学进入有限温度的量子统计力学。前提不同了,采用的极值原理也不同:对于正则系综(即N,V,T恒定),须用Helmholtz自由能的极小化原理,求得平衡时体系中介观粒子的数密度ρ(r);对于巨正则系综,可以用巨势的最低原理

(dWG)T,V,m ≤ 0,求得开放体系平衡时体系中介观粒子的数密度ρ(r)。电子层次的密度泛函理论于是就进一步发展到可以适用于纳米或微米尺度体系的介观的密度泛函理论(文献[10]的16.2节)。回顾表1,它们都是在不同的前提下与最大熵原理或最低能量原理等价的极值原理。可见,Gibbs的说法在理论上达到最大范围的统一和自洽:无论微观还是宏观,无论零温度还是有限温度,无论经典还是量子,一个好的理论无非是对解释自然达到最大范围的统一和自洽而已。

    所以,1949年Einstein曾经感慨道:“一个理论,如果它的前提越简单,而且能说明的各种类型的问题越多,适用的范围越广,那么它给人的印象就越深刻。因此,经典热力学给我留下了深刻的印象。经典热力学是具有普遍内容的唯一的物理理论,我深信,在其基本概念适用的范围内是绝不会被推翻的。”[11]


§4  误读的根源

    把能量最低原理误读为核外电子填充规则,其根源还是教材没有及时跟上。世界各国(不仅中国)化学系本科和研究生的教材中至今还没有把能量最低原理完整地交代给学生。化学系一年级肯定要先讲原子核外电子的排布。学生很快就接受了那个不讲前提条件的“能量越低越稳定”,立刻成为他全部知识的生长基点。此时学生还没有学到熵的概念,更难接受Boltzmann的熵公式,自然无法接受完整的能量最低原理。建议以后老师要提醒学生:严格的概念还在后面,过后会尽早地补上。可惜,拖欠时间太长,竟然忘了要还“债”,到化学系研究生还没补上。完整的最低能量原理目前在欧美各国要到理科物理系研究生的热力学课程中才教到,从60年代初至今,Herbert Callen教授写的书是这方面公认的必读名著(读Gibbs的原著不容易)[7]。

    自然科学中确实有若干少数学科,需要逐级、反复深化才能学懂,它们强调的是知识的深度,而不是广度。但是恰恰就是这少数学科成为科学这棵大树的主干(P.-O. Löwdin语[13])。物理化学就是其中之一。其他强调知识广度的学科,虽然它们数量很大、刊物的影响因子很高(不可排除其原因包括从业人数多得多、文章相对易懂、经济效益明显……等因素),但它们只是这棵大树的叶片。若缺乏大树主干的知识滋养,则叶片也必然发育不良,甚至畸形。

    回顾历史,Gibbs最低能量原理发现至今已经超过百年,即使从Callen书的第一版算起至今也有55年,热力学已经被人以为是夕阳学科。可是,今天化学界对最低能量原理的误读竟然还那么普遍。这说明化学界的物理化学素养已到急需提高的时刻。最新版的《物理化学》名著,如P. Atkins(2014年第10版)、R.G. Mortimer(2008年第3版)、G.M. Barrow(2007年第5版)和Berry-Rice-Ross的(2000年第2版),虽然篇幅都已超过1000页,但还难以满足“中级”深度的需求。盼望出台一门“高等物理化学”的课程,追上时代步伐。近年来,如北大赵新生教授的《中级物理化学》(2010年)和奥地利J.K. Fink的《Physical Chemistry in Depth》(2009年),都反映了这种需求趋势和尝试,很值得称道。我期盼这股浪潮来得更大、更壮观,把化学界推上更高的理性台阶。


参考文献

[1] 戴安邦,尹敬执,严志弦,张青莲,《无机化学教程(上册)》,高等教育出版社,1958年,312页。

[2] 周公度,段连运,《结构化学基础》,第4版,北京大学出版社,2008年;第45页。

[3] 胡英等,《物理化学(中册)》,第4版,高等教育出版社,1999年;9.13节。

   倪申宽,“关于‘能量最低原理’的剖析“,《安徽师大学报》,1986, (4), 44-48。

   高静,“能量最低原理和核外电子排布”,《齐齐哈尔师院学报》,1993, 13(1): 54-61.

   何冰晶,“能量最低原理在高分子化学教学中的应用探索”,《高分子通报》,2011, (12): 141.

   章亚东,“能量最低原理在有机合成反应中的应用研究”,《郑州工业大学学报》,  2000, 21(3): 44-47. 

[4] 洪宗国,“能量最低原理与化学教学”,《中国科教创新导刊》,2008, (11): 100。

[5] 彭笑刚,《物理化学讲义》,高等教育出版社,2012年;第3.2.1节,第89-90页。

[6] Tisza, L., Generalized Thermodynamics, MIT Press, 1966; pp.38-47,129-133。

[7] Callen, H.B., Thermodynamics and an Introduction to Thermostatistics, 2nd ed., John Wiley, New York, 1985; pp.131-137。

[8] 甘子钊教授为北京大学物理学丛书写的序中引用李政道教授的话,见彭桓武、徐锡申著《理论物理基础》,北京大学出版社,1998年,第8页。

[9] 陈敏伯,“热力学的公理体系:论‘凭什么相信计算’之一”,化学通报,2014, 76(5): 388-398.

[10] 陈敏伯,《统计力学:理论化学用书》,科学出版社,2012年;3.1.3节,第16章。

[11] Calaprice, A., The Expanded Quotable Einstein, Princeton University Press, 2000, pp.262-263;中译文取自Kittel, C., 《热物理学》,张福初,梁民基译,人民教育出版社,1981年,第1页。

[12] 傅献彩等,《物理化学(上册)》,第5版,高等教育出版社,2005年;3.8节。

[13] 1985年5月15日瑞典诺贝尔物理学奖评判委员会委员、理论化学家P.-O. Löwdin教授应邀在北京科学会堂作的学术报告。笔者是他报告的现场口译,故印象很深。





https://blog.sciencenet.cn/blog-256218-1120190.html

上一篇:关于能量最低原理的误读_论'凭什么相信计算'之二
下一篇:不要指望未来科学的发展会改变元素周期表的形式
收藏 IP: 183.195.22.*| 热度|

2 刘全慧 黄强

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 14:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部