博文

统一路-4-造物者的奥秘精选

已有 17982 次阅读 2015-3-18 09:03 |个人分类:系列科普|系统分类:科普集锦| 最小作用量, 拉格朗日函数

4. 造物者的奥秘--最小作用量原理

最小作用量原理无疑是大自然最迷人最美妙的原理之一。它的简洁性和普适性令人震撼，就像歌德的诗句中所描述的：“写这灵符的是何等的神人，使我内心的沸腾安静，使我可怜的寸心充满了欢愉，以玄妙的灵机揭开了自然的面巾。”

不仅仅爱因斯坦热衷于他的统一梦，事实上，“走向统一”是任何科学研究领域中的目标之一。因为统一性表达了一种简单之美。科学研究的动力，有时候就来自于对大自然造物简单性的一种信念，科学家们相信，大自然中存在着一些基本的原理，这些原理在许多场合都能适用。比如大家熟知的能量守恒、物质守恒等等。

我们曾经在“数理同源”系列文章中介绍过的最小作用量原理，也是这样一条几乎处处适用、带点“统一”意义的基本原理。根据最小作用量原理，物理系统的运动规律总是使得系统的作用量取极值。也就是说，只要知道了物理系统“作用量”的表达式，然后根据变分原理求极值，就可以得出该系统的物理规律来。不同物理系统有不同的运动规律，经典的力学系统符合牛顿的力学三大定律；经典电磁系统符合的是麦克斯韦方程；广义相对论中有引力场方程；量子力学中有薛定谔方程、狄拉克方程等。最小作用量原理为物理学家们提供了一种统一的方法，以使得对不同的物理系统能推导出不同的方程来。使用这个方法的关键，是要能够写出系统的作用量函数表达式S。而作用量又能写成拉格朗日函数对时间的积分，如下所示：

图4-1：作用量和拉格朗日函数

以上公式中的L便是拉格朗日函数，或称拉格朗日量。因此，利用最小作用量原理^【¹^】，物理学家们在研究不同领域的问题时有了一种统一的语言：“写出系统的拉格朗日量”。因为一旦给出了拉格朗日量，就给定了作用量，然后，也就能从变分法给出系统的方程，也就是给出了“物理定律”。

那么，如何才能知道系统的拉格朗日量呢？这一点在最开始使用作用量原理的年代比较困难，但后来，当物理学家们研究了各种系统，越来越有经验的时候，就不是那么困难了。从另一方面，当我们已经知道了物理定律，比如说，上面所列举的牛顿三定律、麦克斯韦方程等等，也可以倒推而猜出作用量表达式，或者拉格朗日量的表达式来。这听起来有点像“鸡和蛋”的关系，到底是先有物理方程，还是先有作用量呢？历史经验表明，一般是先有物理方程。既然方程已经有了，那么，作用量又有什么用呢？毕竟多一种研究方法便多一层对大自然的深刻认识。回想一下在中学物理中解决力学问题时，我们可以用牛顿定律来求解，也可以使用能量和动量守恒的观点来求解，显然，能量守恒和动量守恒是比牛顿定律更为基本的物理原理。但是，两者皆备相辅相成，使我们对自然规律的理解更为深刻，何乐而不为？

还是回到如何得到拉格朗日量的问题。比如说，在牛顿力学中，如图4-1所示，一个粒子的拉格朗日量等于它的动能减去势能。这听起来好像又有些奇怪：为什么是动能减势能？什么意思啊？为什么不是动能加势能，还可以理解它的物理意义，不就是总能量吗。读者的问题很有道理，动能加势能在分析力学中对应的是哈密顿量。哈密顿量也很重要，爱尔兰数学家和物理学家威廉·哈密顿爵士（SirWilliam Rowan Hamilton，1805-1865）和拉格朗日都对分析力学作出了重要贡献，使用哈密顿量表述的哈密顿正则方程与最小作用量原理的表述是等效的，都能导出牛顿运动定律。不过，大自然安排给哈密顿量的角色是“守恒”，不是“极值”，极值的角色是由作用量S来表演的。在作用量S的表达式中，被积函数是拉格朗日量L，而非哈密顿量H。所以，作用量S是拉格朗日量L对时间的累积效应。也许可以将拉格朗日量解释为某种“cost”（花费）。大自然是个经济学家，它设计的自然规律是要使时间累计的花费最小。落实到单粒子牛顿力学的情况，这种“花费”表现在动能和势能的差别。看起来，大自然也是个懒骨头，不喜欢在动能和势能间转换来转换去，它的法则是使得粒子的动能和势能差别之时间累积为最小。

最小作用量原理、拉格朗日量、哈密顿量这些名词，在经典力学中的位置看起来没有那么重要，处于可有可无的地位，诸位所熟知的恐怕还是牛顿运动定律。但是，到了量子理论中，人们就更喜欢用这些术语来描述物理系统了。原因之一是因为量子论中的不确定性，比如刚才说的单个粒子吧，在经典物理中，用牛顿定律算出它的轨道比讨论拉格朗日量更直观。但是在量子理论中，粒子已经没有了确定的轨道，而只有“弥漫”于整个空间的波函数。这种情况下，波函数难以求解，又不能给出运动的直观图像，还不如研究哈密顿量和拉格朗日量。后面两者似乎更有用处，因为从研究哈密顿量的性质，可以得出粒子可能具有的能级，而从研究拉格朗日量，能深入探讨量子现象和经典运动的联系，总结成一句话：知道了系统的拉格朗日量，就可以由最小作用量原理确定系统满足的物理规律。

所以，我们从一个单粒子（经典电子）的最简单情况开始，研究一下几种相关情形下作用量及拉格朗日量的形式。

图4-2：从单粒子到场的作用量表达式

如图4-2a所示，一个在势场V(q)中运动的质量为m的经典粒子的拉格朗日函数是它的动能与势能之差：

L =T – V = (1/2)m(dq/dt)² – V(q)。

在上式中，q=q(t)，表示这个粒子的位置，(dq/dt)表示粒子的速度。粒子的位置和速度都是随着时间变化的函数。

从单粒子的作用量很容易推广到空间中布满了多个谐振子的情况，如图4-2b所示。图中的q_a(t)表示第a个谐振子的位置函数，m_a是谐振粒子的质量。这种多粒子系统的拉格朗日函数仍然是总动能减去总势能的形式。势能应该包括粒子之间的相互作用势能和其它外场的势能。图中公式描述的是不存在其它外场的情况，相互作用的势能只与谐振子之间距离的平方有关。

为什么要提出这个空间充满了谐振子的模型呢？目的是想为今后浅谈一点“场论”铺平道路。首先想想我们最熟悉的“场”，除了引力场之外，说来说去当然还是电磁场广为人知。不过，绝大多数读者，特别是非物理专业的，所熟悉的是经典电磁场。这儿所谓“经典”的意思就是说与量子没有什么关系。这在麦克斯韦创立电磁理论的时代的确是这么回事，但是到了1905年爱因斯坦利用光量子来解释光电效应之后，情况就有了变化。实际上，那时候的爱因斯坦已经在物理概念上将电磁场“量子化”了，也就是说，有了电磁场是由一个一个光量子组成的概念。爱因斯坦认为，每一个光量子都具有能量E= hν，这份能量只与频率有关，由此才成功解释了光电效应。光量子具有固定频率的事实，使人们很自然地联想到谐振子。并且，这种既是粒子又是波的“波粒二重性”，既能用到光子上，也能用到电子和其它微观粒子上。因此，从量子的角度，我们便可将弥漫于空间的“场”，想象成密密麻麻均匀布满空间的谐振子了。因为谐振子在场所在的空间中无处不在，并且互相之间的距离很小，我们又可以把它们从一个一个分离的状态，改换成用连续的函数来描述。具体过程就是如图4-2c所示的，首先将谐振子的分离位置函数q_a(t)，用连续函数q(t,x)代替，然后再按照通常表示“场”的符号，写成f(t,x)。此外，求和符号则用时空中的积分替代。而原来的经典拉格朗日量，则变成了时空中的拉格朗日量密度：

L = (1/2)( ∂f)² – (1/2)m² (f)²。

不喜欢数学公式的读者，也不用被这些公式吓倒。上面一式的目的，只是为了说明，无论是描述单个粒子还是场，拉格朗日量都有看起来类似的形式：动能减势能。动能部分是两个变量的微分相乘，势能部分是两个变量相乘。经典粒子和量子“场”，只不过拉氏量中的变量不同而已，经典粒子的变量是它的位置函数q(t)，场的变量是场函数f(t,x)。

参考资料：

【1】Kline, Morris (1972). Mathematical Thought from Ancient toModern Times. New York: Oxford University Press.