|
最小作用量原理与能量守恒定律
一.最小作用量原理的起源
物理学家的梦想是在一张小纸片中写下整个宇宙的秘密,而最小作用量原理可能就是必写的原理之一.最小作用量原理的提出有着极为深刻的科学与哲学内涵:它最早来自于生活中各种极值的思想,以及自然界中的各种极值现象,并最终演化成在物理和数学领域都有广泛应用的变分方法.物理学是研究物质结构及其运动规律的科学,物质的结构往往由体系的能量最小或熵最大等某些物理量的极值确定,如水珠的形状、凝聚态物相,甚至银河系的形状等,这正体现了最小作用量原理的威力.另一方面,我们现在所知道的物质运动方程都可以在写出相应的拉格朗日量后,通过最小作用量原理推导出.因此,最小作用量原理被科学家看作是物理学,甚至是自然界最具普适性的基本原理,它具备简洁和统一的科学美学特征,在物理学乃至科学发展史中有着极其重要的地位.
定律是科学家对经验事实的概括和提高,其正确性直接受实践检验.定理是由定律根据逻辑推理规则拓广后得到的结论.“原理”是什么?科学原理是科学家用理性思维高度概括了许多定律和定理后所得到的高一层次的,兼具哲学信仰和数学定义性质的科学理念,其正确性一般是从多个不同领域的定律、定理都可由原理根据逻辑推理得到来作出评价的,而不是直接受实践检验的.物理学中的原理第一个为学术界普遍接受的是牛顿的《自然哲学的数学原理》,另一个是热学中的“熵”增加原理.
经典力学理论发展到了拉格朗日-哈密顿时代,有多个物理学家提出了可用“最小作用量原理”来取代牛顿力学的原理,最小作用量原理的内涵就是泛函拉格朗日函数取极值.在直角坐标系中,对于自变量(x)来说,函数可表达为y=y(x).假如所要研究的对象不能够用一个未知数(x)表达出来,而是自变量必须用一个未知数表达出来,但客观上与之前的问题仍然相似,仍然体现为一个因素不停改变,导致结果也相应地随之变化.于是可用类似函数的方式去解决该问题,该类似的函数就是泛函.这意味着泛函就是函数的函数.普通函数求极值的方法就是求导法;而泛函是函数的函数,因此泛函求极值方法与普通函数是相似的.泛函的微分是指自变量不再是x而是y(x),而是y(x)与x之间的映射关系;因此纵坐标的变化内函是指,自变量x不变但映射关系发生改变导致纵坐标发生的变化,这就是自变函数的变分.此外,变分运算和积分,微分运算的顺序是可以交换的.泛函极值条件欧拉方程;这意味着,泛函极值问题可转化为函数的极值问题.最小作用量原理就是,在完整有势系统里,真实运动所代表的泛函必须取极值(拉格朗日函数就是真实路径的一种表达形式).最小作用量原理的大意是:一个力学体系如果其初态和终态都是确定了的,中间的过程如何进行,除了必须受各种约束条件的限制外,不作规定,中间过程可以有许许多多.最小作用量原理说,满足动力学规律的实际发生的过程,与其他各种满足约束条件的可能过程作比较,真实过程的作用量变化最小.力学理论中的“作用量”是一个怎么样的物理量?它有许多不同的表示形式,能量*时间、坐标*动量、角动量等都具有作用量的“量纲”,都是作用量,所以最小作用量原理有多种不同的表示形式,哈密顿原理是其中的一种.
最小作用量原理的思想之源,来自与生活中的各种极值的思想以及自然界中的各种极值现象.公元40年希腊工程师提出了光的最短路程原理,是最小作用量原理的早期表述,到中世纪最小作用量原理思想被更多的人接受.作为研究光线的反射和折射的结果,费马曾经得出这样的结论:自然界中总是通过最短路径发生作用.
真正提出著名的最小作用量原理(不仅仅是最小时间原理),并赋予它以极大的普遍性的人,是法国物理学家莫泊丢(P.L.MdeMaupertuis,1698—1759).1744年4月15日,莫泊丢向法国科学院提交了题为“论各种似乎不和谐的自然律间一致性”论文,他在费马原理的基础上提出了适用于各种物理现象的“最小作用量原理”.他指出:体系实际发生的真正运动是使某一个作用量取最小值的运动,并表示为mvs=min.莫泊丢提出的观点似乎意味着,只要能在某种物理现象中找到合适的作用量,令其取的最小值,那么所有的物理现象都可以得到解释.而莫泊丢的另一个重要贡献在于,基于这样的思想,他在研究碰撞问题过程中,首次将最小作用量原理与守恒定律联系起来.但也仅仅是通过选取碰撞过程中的物体动能为作用量,通过极值运算,导出了动量守恒,并没有揭示最小作用量原理与守恒律更深一层的联系.其出发点在于,“自然界发生的一切现象中,作用量的变化时最小的”.他用这样几句话说明了这个原理:“自然界总是通过最简单的方法产生作用的,如果一个物体没有任何阻碍地从一点到另一点,自然界就利用最短的途径和最快的速度来引导它.简单的说,这意味着任何不受影响的动力学系统在发生变化时,其变化方式总是使有关的作用量最小.物理学中描述物理实在结构的方法之一就是作用量方法,这种方法从功能角度去考察和比较客体一切可能的运动,认为客体的实际运动可以由作用量求极值得出.
使最小作用量发生质的飞跃的使法国数学家费马[Fermat,1601~1665].他在对光的折射的研究中发现最短程原理并不成立,然而他相信自然界的行为总是采取某种最简捷的方式.1657年费马用“最短时间原理”,使以前彼此独立无关的光的直线传播定律、反射定律、折射定律以及光路可逆性原理游了一个统一而又简捷、优美的表述.1682年以后德国哲学家和数学家莱布尼兹Leibniz,开始试图建立一个能支配所有力学过程和光学过程的“作用量”的概念,没有成功.哈密顿同时认为最小作用量原理极为广阔,不只与动力学、光学相关,而且也涉及到全部物理学.姆霍兹赫1886年他把这一原理系统地运用于力学、热力学和电动力学等问题,并做了关于电动力学中最小作用量原理的论述.爱尔兰数学家和物理学家哈密顿Hamilton从光学的研究开始,利用力学与几何光学运动方程中的相似性,即一种对偶性思想,启发了哈密顿.光线轨迹可以利用对单一数学量——特征函数的计算得到,与单粒子动力学作用量函数的特征值非常相似,而几何光学中光线轨迹又与牛顿力学单粒子的轨迹相似他猜想,一定可以找到一种与几何光学类似的形式来表述力学规律,只要从力学的最小作用量原理出发,把他变换为与费马原理相似的形式,就一定可以找到力学与光学的统一表示.哈密顿使用具有动力学意义的正则变量(广义)替代只有运动学意义的广义速度和广义坐标,把拉格朗日函数和拉格朗日方程变换到哈密顿函数和哈密顿正则方程,对比费马原理提出了等时最小作用量原理,即哈密顿原理,这种思维对于现在的我们是一种很好的启发.
一个运动中的物体的作用量为 ,其中为物体的质量,v为移动速度,s为移动距离.最后总结得出最小作用量原理的定义为:自然界总是通过最简单的方法产生作用的,如果一个物体没有任何阻碍地从一点到另一点,自然界就利用最短的途径和最快的速度来引导它.十九世纪初期拉格朗日在前人提出的“最小作用原理”的基础上提出了关于刚体的最小势能原理.经过人们不断对自然界的认识,人们得出自然界中一切变化或者不变化的系统都必须遵守能量守恒定律和最小作用量原理.这两个定理是相互独立的,没有任何联系.
由于深受马赫、基尔霍夫,尤其是亥姆霍兹的统一性思想的影响,赫兹坚信“物理学的任务在于把自然现象归结为简单的力学定律”,进而努力寻找支配自然界的统一原理的数学表达式.在这种信念的驱动下,赫兹着手对传统的力学,并对分别建立在力和能量这两个基本概念基础上的力学,进行了深入的剖析和批判.对于力,赫兹指出,在力学中“力”这个概念是蒙昧时代的观念的遗迹,“力”的实质是什么,本是一个“含糊不清”的问题,物理学家并不十分了解“力”的真正含义.以它作为力学的原始概念,无助于我们去精确地进行推理,从而演绎出美的科学理论来.力不是一个可直接测量的,或者说不是一个基本的物理量,只能间接的理解它.因此赫兹认为,用这种表述构建的科学理论显然不严密、最小作用量原理及其应用不简洁.对于基于能量的分析力学,在赫兹看来,这样做的结果,“力”只是一个辅助性的、被定义的概念,可取之处在于回避了力的概念的不精确性.与此同时,因为能量是由位置与速度所决定的,而这两者是完全可以直接观测到的.即便如此,赫兹仍认为,对能量的这种表述用来表示势能就存在着很大的困难,特别是当必须把一个力学系统的势能取作负值,或者把一个有限物质的势能看作无穷大时,这就无法摆脱逻辑上的矛盾.于是,赫兹认定用这种表述方法创立的科学理论不可能是自洽的.基于对传统的力学的批判,赫兹认为,他所创立的《力学原理》,既要显示经典力学的系统性,又要提高它的严密性,完全遵循着演绎法的形式规则和思维经济的原则,把必要的假设减到最小的程度.于是,在赫兹的力学中,与经验相联系的,严格可观测的时间、空间和质量这三个概念成了原始的基本概念.此外,赫兹还引入了亥姆霍兹提出的隐质量概念作为补充,而势能(力)则源于隐质量的隐运动,亦即势能起源于动能.此后,赫兹还提出了一条力学短程线原理,作为他的力学的一条基本定律.根据这一原理,平直空间中受力物体的运动就等价于弯曲空间中自由物体的运动,从而使动力学问题变成了运动学的问题,这正是广义相对论的基本思想.赫兹的力学短程线原理完全继承了费玛、欧拉、拉格朗日等人关于最小作用量原理的科学美学传统.因为最小作用量原理=0是以其特有的简单性之美所发射出的真理之光,立足于物理学的最高原理之中.力学短程线原理——任何自由系统均保持其静止或沿最直轨道匀速运动的状态,同样以高度简洁的形式,将牛顿力学、拉格朗日力学、哈密顿力学包含在内.在经典力学体系中,保守体系的作用量为S=,其中T和V是用广义坐标和时间表示的动能和势能,实际力学过程就是使作用量S取极小值的过程.
王振发先生在“21世纪高等院校教材”《分析力学》中给出了“力学原理的分类原则”——“力学原理可分为两大类:不变分原理和变分原理.每一类又可分为两种不同的形式:微分形式和积分形式.”[1]“不变分原理是反映力学系统真实运动的普遍规律.如果原理本身只表明某一瞬时状态系统的运动规律,称为微分原理,例如达朗伯原理就是不变分微分原理.如果原理是说明一有限时间过程系统的运动规律,则称为积分原理,例如机械能守恒原理即不变分的积分原理.而变分原理则不同,它提供一种准则…….如果准则是对某一瞬时状态而言的,则该原理为微分变分原理,例如虚位移原理,动力学普遍方程…….如果准则是对一有限时间过程而言的,则该原理为积分变分原理,例如哈密顿原理,拉格朗日最小作用量原理…….”[1]从数学的稳定性讲,在最高点的平衡属于不稳平衡,而在最低点的平衡属于稳定平衡,从宏观热现象的自然特征考虑:自然界中处在非平衡态的孤立系统会自发的趋于平衡状态.
赫兹所要建立的是一种没有“力”的力学,追求的是一种比分析力学更深层次的理论.尽管赫兹的力学理论就物理学的范围而言,没有得到广泛的发展.但赫兹的精神与思想,被爱因斯坦、薛定谔所关注、继承和发扬,它对广义相对论和量子力学的创立产生了重要的影响.如1916年爱因斯坦提出的广义相对论,正是以类似于《力学原理》的方式,把万有引力这一自然界中最基本的力的作用解释为空间的弯曲.此后,薛定谔进一步探讨了赫兹力学和爱因斯坦引力理论间的联系,并结合最小作用量原理和光学的类比,于1926年建立了波动力学.而始终贯穿其中的,一直都是最小作用量的思想,从光学到到力学,最小作用量原理已经渗透到了物理学的每一个角落.
二.最小作用量原理在物理学中的重要位置
一切事物非事物自己如此,日月无人燃而自明,星辰无人列而自序,禽兽无人造而自生,风无人扇而自动,水无人推而自流,草木无人种而自生,不呼吸而自呼吸,不心跳而自心跳,等等不可尽言皆自己如此.因一切事物非事物,不约而同,统一遵循某种东西,无有例外.它即变化之本,不生不灭,无形无象,无始无终,无所不包,其大无外,其小无内,过而变之、亘古不变.其始无名,不知谁之子,“老子”强名曰:“道”.最小作用量原理是物理学中描述客观事物规律的一种方法,即从一个角度比较客体一切可能的运动(经历),认为客体的实际运动(经历)可以由作用量求极值得出,即作用量最小的那个经历.
费曼说过:“今天我们所了解的最好的定律,实际上是两者的结合,换言之,我们用最小作用量原理加上局域性.今天,我们相信物理定律必须是局域的,也必须服从最小作用量原理.”爱因斯坦指出,一切科学发现的伟大目标在于“寻找一个能把观察到的事实联系在一起的思想体系,它将具有更大可能的简单性.”最小作用量原理不仅几乎把已知的事实,而且也将未知的事实纳入到一个思想体系中,其简单、优美,其具有高度的抽象性,又不失各种形象化的案例,在物理规律总又具有高度的统一性,最小作用量原理无疑已成为物理学的最高理论.着名物理学家普朗克认为:“在几个世纪以来的标志物理学成就的一般法则中,就形式和内容而言,最小作用量原理可能是最接近于理论研究的最终目的的.”在最小作用量原理中,通过选择不同的作用量几乎可以建立全部的理论物理学.文献[1]从最小作用量原理导出了牛顿第一定律、牛顿第二定律、牛顿第三定律和伽利略相对性原理(力学相对性原理).19世纪末拉莫从最小作用量原理导出了麦克斯韦方程组,从而也就导出了全部电磁学的基本规律.哈密顿认为:虽然最小作用量原理已如此立足于物理学最高原理之林,然而从宇宙的经济学观点来看,…不能把量的经济性看做是宇宙的神圣的思想而设计的,尽管某种简单性可以被认为包括在这种思想之中.
最小作用量原理的形成历史是曲折的,给予S以作用量命名,也反映了物质世界的统一性,更揭示了物理学不同分支之间的统一性.最小作用原理是物理学中描述客观事物规律的一种方法,即从一个角度比较客体的一切可能运动,认为客体的实际运动可以由作用量求极值得出,即作用量最小的那个经历.
物理学中有一些规律属于基本定律,它们具有支配全局的性质,掌握它们显然是极端重要的.例如力学中的牛顿定律是质点、质点组机械运动(非相对论)的基本定律,电磁学的麦克斯韦方程组是电磁场分布、变化的基本定律,物理学中还有另外一种基本定律的表述形式,这就是最小作用原理(变分原理),它可表述为系统的各种相邻的经历中,真实经历使作用量取极值.可以看出最小作用原理的表述形式与牛顿定律、麦克斯韦方程组的表述形式极不相同.牛顿定律告诉我们,质点此时此刻的加速度由它此时此刻所受的力和它的质量的比值决定;麦克斯韦方程组告诉我们,此时此刻的电场分布由此时此刻的电荷分布以及此时此刻的磁场的变化决定,此时此刻的磁场分布由此时此刻的电流分布以及此时此刻的电场的变化决定,它们以微分方程式的形式出现,指明所研究系统(质点或场)的状态在其真实经历中是如何随时间变化的.而最小作用原理则告诉我们,系统的各种可能的经历中,真实的经历总是使作用量取极值.牛顿定律和麦克斯韦方程组把注意力集中在每一时刻系统所处的状态,而最小作用原理则是总观系统的各种可能的经历,并用作用量取极值挑选出真实的经历来.可以看出牛顿定律和麦克斯韦方程组比较具体细致,而最小作用原理则比较抽象含蓄.正是最小作用原理比较抽象含蓄,它概括的面更广泛,不仅适用于机械运动(非相对论)场合,可以导出牛顿定律;而且也适合于电磁场场合,可以导出麦克斯韦方程组;甚至它还可以适合其他场合,导出物理学其他领域的基本定律,可见最小作用原理才是综合整个物理学的真正的基本定律.
根据最小作用原理导出各个领域的具体基本定律的方法就是先找出系统不同经历的作用量来,然后从中选择出相对邻近的经历作用量取极值的经历,它就是真实的经历,其中隐含了系统变化的基本定律.在这点,要找出游同经历的作用量,对称性分析起着决定性的作用,对称性制约物理定律的形式得到最好的体现.如果一具研究领域内的全部对称性已经清楚,则作用量可以完全被确定,从而也就可以得出这个领域的基本定律.例如在非相对论力学范围内,根据空间各向同性、空间平移不变性、时间平移不变性和伽利略变换不变性,可以找出作用量等于系统的动能减去势能对经历的累加,由此可导出牛顿定律.
由于存在最小作用原理,对称性在物理基础研究中显示出其重要地位.物理学家通过对称性分析找出不同经历的作用量,从而确定具体领域的基本定律.物理学家们研究一个新的领域,常常是试探地分析其中的对称性,在描述这个世界的作用量公式中增加一些描述新领域的项,从而得到该领域的新的基本定律.由于作用量S是坐标变换中不变量,因此哈氏原理与坐标的选择没有关系,而牛顿方程等却随着坐标的选择而变.
三.最小作用量原理与能量守恒定律
彭加勒认为:作为普遍的原理,最小作用量原理和能量守恒原理具有极高的价值.能量守恒原理所指出的只是什么样的运动是可能的,在物体运动的每一种情况下能量守恒原理都能得到一个方程,然而一个方程是不能单值地决定实际的运动.为此有多少表证运动的独立坐标就需要有多少方程,比如确定自由质点的运动就需要三个方程,最小作用量原理却提供了必要数量的方程.功能原理与能量守恒定律的本质是一致的,功能原理从属于能量守恒定律.把热功率看做电路系统里的作用量.电路里实际的电流分配方式总是以输出热功率最小的原则的,由此可以得到其他的实验定律.
从最小作用量原理出发,在时间均匀的前提下可以得到能量守恒定律.若时间不均匀,能量守恒定律的成立问题仍处于研究之中,这种情况在广义相对论中尤为突出.在广义相对论中,时空弯曲、时间非均匀、引力能无法局域化,广义相对论中能量守恒问题至今还未得到解决.作用量S或许比能量概念更为重要,能量反映了各种运动之间相互转化的共同量度,作用量则反映各种运动过程必须满足的共同性质,作用量的量纲是[能量·时间],是能量与时间的统一,能量仅反映了作用量中的一部分联系.
随着最小作用量原理的发展,以及守恒律、对称性的理论研究,三者之间的关系也渐渐明朗起来,1918年E·诺特在题为“变分问题的不变量”论文中提出著名的“诺特定理”,至此,我们已经可以从理论上寻找作用量的数学形式,通过对称、守恒与最小作用三者之间的关系有效地写出正确的作用量函数,这种方法进而发展为规范场论.
能量守恒原理所指出的只是什么样的运动是可能的.在物体运动的每一种情况下能量守恒原理都能得到一个方程,然而一个方程是不能单值地决定实际的运动.为此有多少表证运动的独立坐标就需要有多少方程,比如确定自由质点的运动就需要三个方程.最小作用量原理却提供了必要数量的方程.
亥姆霍兹认为自然科学的任务就在于寻求全部必然性规律,而把全部物理现象归之于力学原理乃是理解自然界的基础.在“论最小作用量原理的物理意义”一文中通过对不同的力学原理的深入比较,他认为最小作用量原理将是物理学的统一性原理的最佳候选者.借助动势有关的隐运动的概念,亥姆霍兹得到了最小势能原理的普遍表达式:
,其中为自由能,为系统的内能,为绝对温度,为系统的熵.这里的自由变量是系统的位置坐标,体积和温度.为系统的动能,为这些参量变化时外界对系统所做的功.由此通过最小作用量原理,物理学不同分歧就互相联系起来了,正如通过能量守恒与转化定律将不同现象联系起来一样.
亥姆霍兹从哈密顿方程出发为热力学第二定律发展了一种力学类比,他深知真正的热力学系统并不是周期系统.亥姆霍兹的单周期系统研究所提供的虽然仅仅是一种类比,但是其启发性意义却不可小视.亥姆霍兹的研究表明,可逆过程的规律及熵定理都可以用拉格朗日方程来表示,因而他们也就可以用哈密顿形式的最小作用量原理来表述.从而暗示了最小作用量原理的某种有待阐明的普遍性,作为最小作用量原理的成功运用,亥姆霍兹考察了热力学和电磁学的不同学说,他证明了热力学第二定律与最小作用量原理本质相一致.
热力学第一定律包含能量守恒定律,热力学第二定律包含最小作用量原理.一般的系统发生变化必须同时满足热力学第一定律和热力学第二定律,缺少一个定律的变化的系统都是不存在的.
自然界一切变化的过程必须遵从热力学第一定律,那么,是否任何遵从热力学第一定律的过程都能发生呢?答案是否定的,第一类永动机的设计失败给了我们很好的答案.是否任何遵从热力学第二定律的过程都能发生呢?答案也是否定的,第二类永动机的设计失败同样给了我们答案.一个系统无论怎么变化我们都可以将其看成是一个热力学过程,而热力学过程必须同时遵守热力学所有定律.所以说一切变化的系统或个体都必须同时满足热力学第一和第二定律.
金属材料发生弹性变形也一样,满足了热力学第一定律,同时也必须满足热力学第二定律.金属材料受力发生弹性变形,在考虑能量守恒的情况下,也要考虑能量的分布情况,分布是朝着熵增的方向进行的.
四.最小作用量原理与相对论
爱因斯坦发展广义相对论的动机之一是,牛顿力学未能正确预测水星的轨道.如果用爱因斯坦方程来计算水星轨道,得到的结果符合我们对水星近日点进动的观测值.如果最小作用量原理真的是一个基本定律,那么它应该有一个相对论版本,我们可以最小化它来找到水星的轨道.毕竟,行星在其轨道上运行时,能量会在势能和动能之间进行交换,就像我们所讨论的球一样.事实证明,我们只要进行一些相对论修正就可以做到这一点.在这里,最重要的是要把拉格朗日量写成固有时的函数.在相对论中,时钟以不同的速度运行,这取决于相对速度和在引力场中的位置等因素,而固有时是物体在自己的参照系中所感知到的时间.如果将相对论拉格朗日量代入欧拉-拉格朗日方程,就会得到正确描述水星绕太阳运动的轨道.
事实上,通过这个例子,我们也开始了解了作用量的本质.应用相对论进行修正,作用量就简化成一个固有时的积分.之前,作用量是一个关于能量变化的模糊概念,但利用更为精确的宇宙模型,我们就会发现作用量是观察者在自己参考系中感知到的时间的多少.所有在时空中运动的物体所经过的路径,都是在该路径上所测量到的时间最小化.最小作用量原理可以用在广义相对论,那么它可以用在量子力学吗?答案是可以的.
参考文献:
[1]王振发,分析力学[M],科学出版社,2002:110.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 17:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社