tianrong1945的个人博客分享 http://blog.sciencenet.cn/u/tianrong1945

博文

《数理同源》-4-数学家的绝招 精选

已有 16641 次阅读 2014-3-19 08:52 |个人分类:系列科普|系统分类:科普集锦| 泛函, 变分

3. 数学家的绝招

伯努利家族的几位数学家当时曾经叱咤风云,但无论如何也掩盖不了大师级的瑞士数学家和物理学家欧拉的夺目光辉。

莱昂哈德·欧拉(LeonhardEuler17071783)是约翰•伯努利的学生。尽管约翰小气到连自己的儿子都会妒忌,却早早地就认识到了欧拉的数学才能。他说服了欧拉的父亲,让16岁的欧拉从神学转到数学,成为自己的博士生。天才的欧拉在19岁时就完成了他的博士论文,20岁时被丹尼尔·伯努利邀请到俄国圣彼得堡的俄国皇家科学院工作,直到1741年转到柏林,他一生大部分时间都在俄国和普鲁士度过。不像老师约翰•伯努利的喜争好斗,欧拉一生仁慈且宽容。欧拉很早就有严重的视力障碍,最后17年双眼完全失明,但他乐观而自信,仍然用对儿子口述的方式坚持发展他平生钟爱的数学。

欧拉成就斐然、著作甚丰,在数学的每个角落都能找到他的踪影。本节将叙述的他在泛函变分以及微分方程理论中的先驱作用,不过是大师巨大成就中的泰山一角、沧海一粟而已。

上一节中介绍的变分法,始于17世纪末期雅各布对最速落径问题的解答,雅各布用了一点变分的思想,但却并未系统化,并且,“变分法”这个名称,是欧拉在1766年才根据拉格朗日的一封信中的命名而给出的。

约瑟夫·拉格朗日(Joseph-LouisLagrange1736-1813)是法国数学家,要比欧拉晚生30年,但和欧拉年轻时一样,是个天才少年。

1:(a)不均匀介质中的光线(b)等时下降曲线(c)等周期的摆钟

上节中叙述过摆线,看起来这个被伽利略命名的摆线在当时还挺受宠的,因为好几个问题的答案都是它。摆线最原始的定义是指圆滚动时边沿一点的轨迹,后来发现最速落径是摆线,约翰·伯努利还发现光在折射率与深度成正比的介质中的轨迹也是摆线,见图1a。后来数学家对等时曲线(tautochrone)问题加以研究,答案也是摆线。

惠更斯(ChristiaanHuygens16291695)对这几个与摆线有关的问题都进行过深入钻研。在他的《摆钟》一书中1,他描述了一种周期相等的“摆”(图1c),这不同于一般情形中摆线伸直而长度固定的钟摆。在上述的一般情形下,当摆长固定时,摆锤作的是圆周运动。中学物理中大家就学过,当摆动的振幅很小时,可以近似地将摆锤的运动当作是周期不随初始位置而变的简谐运动,但如果振幅太大就不行了。惠更斯发现,如果用某种方法,使得摆锤运动的轨迹是倒过来的“摆线”的话,如此而设计的摆钟将是等时的。也就是说,在这种曲线上,摆锤运动的周期不依赖于摆锤的初始位置。这个问题后来被等效地表述为如下的等时曲线问题。

设想一个在重力作用下无摩擦地向下滑动的小球,如图1b所示。等时曲线是这样一种曲线:所有初始速度为0、同时出发的小球,(比如图中的ABCD位置上面,分别放了小球1234),无论它们起始于哪一个高度,所有的小球将同时到达曲线的最低点E。等时曲线乍一听有点奇怪,不同位置的小球怎么会同时到达地面呢?仔细想想就容易明白了:小球的初始位置不同,正好使得它们具有不同的势能,使得滑下来的速度有快有慢,距离地面远的小球滑动速度快,离地近的速度慢,而最后便可能同时到达。惠更斯证明了,这个等时曲线是存在的,和最速落径问题的解答相同,也是倒放着的摆线。

几十年之后,年轻的(19岁时)拉格朗日又对等时曲线、及等周曲线(见之后的第5节)等变分问题发生了兴趣,并与当时已经成名的数学大师欧拉多次通信讨论有关变分及泛函分析。在欧拉的宽容和鼓励下,以此研究为基础写出了他的第一篇有价值的论文“极大极小的方法研究”。之后,欧拉肯定了拉格朗日1760年发表的一篇用分析方法建立变分法的代表作,并正式将此方法命名为“变分法”。

拉格朗日的功劳是完全用分析的方法解决了一般的变分问题。当牛顿初建微积分的时候,主要考虑时间为自变量。推广到更一般的情形,自变量数目可以增多,但仍然是一个分离而有限的数目。变分法要处理的自变量却是一个变幻无穷的函数,从原始微积分的角度来看,那意味着自变量的数目是无限多!该如何处理这种无限多个连续自变量的问题呢?数学家们总是有他们的绝招。我们在下面简单描述一下变分分析的精神所在,并由此而导出变分法中基本的欧拉-拉格朗日方程。

经典的变分问题除了曾经叙述过的最速落径问题、光线轨迹、等时曲线之外,还有测地线问题、等周问题、牛顿最早提出的阻力最小的旋转曲面问题,等等。这些问题都可以表示成下面的积分形式:

 

                                                                                                                             1

这儿的x是自变量,yx的函数,可以写成y(x)y’y(x)x的微商。因为y是一个函数,所以,J便是函数的函数,即泛函。变分法提出的问题就是:对什么样的函数yJ将取极小(或极大)值?为叙述方便起见,在以后的文中只谈及“极小值”。

假设这个极值函数已经找到,用图2b中的红色曲线y(x)表示。也就是说,y(x)是我们要求的泛函问题的解,它使得公式(1)的泛函J有极小值。那么,泛函在极值附近将有些什么特点呢?为此,我们可以先看看一般函数在极值附近的特点。曲线在极值附近时,函数所对应的一阶导数为0,也就是说,极值附近曲线的切线是水平方向的,切线水平意味着自变量变化时,函数值不怎么变化,既不上升也不下降,变化(即函数的微分)为0。对泛函的情况也是这样,如果泛函Jy(x)有极值的话,当解函数y(x)变化时,泛函J几乎不变化,即变分为0


2:变分法分析

函数中自变量x的变化好说,我们用dx来表示其变化。比如,如果x是实数,dx便是一个很小的实数而已。而泛函是函数的函数,泛函的自变量是一个函数,函数可以千奇百怪地变化,在最速落径问题中唯一需要满足的条件是:在AB两个端点的函数值是固定的。那么,我们如何用数学语言来表示y(x)附近变化的各种函数呢?在拉普拉斯之前,比如雅各布,是将自变量x在某些位置的数值来一点点变化,如图2a所示,再运用几何直观的方法,加上具体问题的物理规律,从而得到函数y(x)的变化,然后令此变化为0而导出具体问题的方程。欧拉后来推广了雅各布求解最速落径问题的方法到一般的情况,将y(x)分成若干段一节一节更小的曲线,用求和代替公式(1)中的积分,得到了泛函分析中最重要的欧拉方程。但欧拉所使用的,万变未离其宗,仍然属于变动x的几何类方法。

拉普拉斯很巧妙地改进了欧拉的办法2。如图2b所示,所有的千奇百怪的试验函数Y(x),可以写成解函数y(x)加上一个扰动函数之和。这个扰动函数则写成一个小实数变量 e与另一个任意连续函数h(x)的乘积:

Y(x) = y(x) + e h(x)                                      (2)

这样做的结果就像是将扰动的幅度变化和形状变化分开来了。幅度变化取决于实数变量 e,而函数形状的变化则由函数h(x)表征。对函数h(x)的要求不多:它们是至少有连续的一阶导数,两个端点值为0的任何函数,如图2b左上角的曲线所示。然后,将表达式(2)代入到积分公式(1)的被积函数f(x,Y,Y')中。因为公式的右边是关于x的积分,积分之后,表面上看起来,函数h(x)消失了,积分结果J(e)只是e的函数。但实际上,正确的说法应该是:函数h(x)被吸收到了J(e)之中。因为不同的h(x),将会得到不同形状的J(e)。图2b中右边的两个函数曲线,便是对应于不同的h(x)而得到的不同J(e)

虽然不同的h(x)得到不同的J(e),但这所有的J(e)函数有一个共同的特点:当e等于0的时候,函数J(e)的一阶导数为0,这是函数取极值的必要条件。如图2b右图所示,也就是说,函数J(e)0点有极小值。这个性质可以很容易地从公式(2)看出来,因为当e等于0的时候,试验函数就是该泛函问题要寻求的解:y(x),这个解函数将使得J的变分为0,亦即J(e)e的微分为0

以上描述的方法很巧妙地将泛函变分的问题,等效地转化成了一个函数J(e)对一个实数变量e取微分求极值的问题,将对函数的求导变成了对单变量的求导。当然,两者仍然是有所区别的,这区别是在于这儿包括了一个任意函数h(x)。解决这个后续问题时玩的花招也是在这“任意”二字上。

首先,类似于解决函数极值的方法,我们需要求J(e)e的微分。根据微积分的基本法则,因为积分限与e无关,微分符号便可以直接穿过公式(1)右边的积分符号而变成全微分应用到f(x,Y,Y')上。然后再利用J(e)e的微分等于0这一点,得到一个积分为0的表达式。如下面的公式(3)所示,这个积分的被积函数是两部分的乘积:


公式(3)中,被积函数的第一部分是f的偏微分表达式,第二部分则是任意函数h(x)。现在,这两部分相乘之后再积分的结果为0。而我们知道,h(x)是一个任意函数,怎么样的函数乘上一个任意函数再积分后将会使得结果总是为0呢?显然只有当这个函数为0的时候才能做到这点。如此一来,我们便得到了如公式(4)所示的微分方程。这就是变分法中最基本的欧拉-拉格朗日方程。

附件:从公式(1)、(2)到(3)的简单推导:


参考资料:

1C.Huygens, "The Pendulum Clock or Geometrical Demonstrations Concerning theMotion of Pendula (sic) as Applied to Clocks," Translated by R. J.Blackwell, Iowa State University Press (Ames, Iowa, USA, 1986).

2CourantR, Hilbert D (1953). Methods of Mathematical Physics. Vol. I (First Englished.). New York, New York: Interscience Publishers, Inc. pp. 184–5

上一篇:哪条路径最快?

系列科普目录

下一篇 :数学的诗篇





https://blog.sciencenet.cn/blog-677221-777274.html

上一篇:《数理同源》-3-哪条路径最快?
下一篇:大爆炸的余音-引力波
收藏 IP: 24.1.57.*| 热度|

37 罗德海 严晓文 杨建军 徐传胜 冷永刚 康娴 李志军 强涛 韦玉程 田云川 叶绿洲 王金良 王涛 张林 杨森 董侠 陈威华 刘全慧 李伟钢 徐晓 王国强 罗会仟 贺鹏 杨金波 薛加民 史智才 王云龙 刘浔江 李帅军 chenyuhuazililu happyspoon dulizhi95 cloudyou guoyanghuawu rosejump feishay YJM1225

该博文允许注册用户评论 请点击登录 评论 (35 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-20 15:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部