|||
5. 狄多女王的智慧
再回到经典变分问题,补充介绍一个著名的的例子:等周问题(Isoperimetricinequality)。
等周问题来源于公元前200多年的古希腊。据说狄多(Dido)女王因为智慧地解决了这个问题而建立了迦太基城。问题听起来挺简单的:给你一条长度固定的绳子,如何用它在平面上围出一块最大的面积?人们很容易直观地得出问题的答案是一个圆,如同两千多年前的狄多女王的直觉一样,好像也不需要很多智慧。但是,要真正从数学上严格证明这个问题却不那么容易了,一直到十九世纪(1838年)才被雅各·史坦纳用几何方法证明【1】。
图1:圆形是等周问题的解的简单说明
从图1所示的几个图形,可以对等周问题的答案进行一点简单的直观几何解释:(a)图表明,解曲线一定是处处“凸”的。因为如果某处凹下去了的话,便可以用与图a类似的方法将凹处边缘对称于红线翻转到虚线的位置而变“凸”,却仍然保持同样的周长,得到更大的面积。(b)图说明:在固定周长的情形下,图形越对称,面积越大。(c)图则表明,正方形不可能是等周长图形中面积最大的。因为我们可以将方形的一个角剪去再拼到一条边上,这样作了之后得到的图形与原来方形有相同的面积和周长但却不是完全凸的,所以面积不是最大。从以上三个直观理解可以得出如下结论:等周长而围成最大面积的那个图形,应该是“最凸”和“最对称”的。那么,基于直观感觉,符合这两个要求的,应该是非圆莫属!
我们感兴趣的是从变分法的角度来分析解决这个问题。这个问题与前面所述的几个变分法例子的不同之处是除了需要求泛函的极值(围成的面积最大)之外,还包含了一个较为复杂的约束条件:图形的周长不变。
1776年,年轻的拉格朗日(19岁)提出了拉氏乘子法,用以解决带约束条件的极值问题。被欧拉称赞为“这应该是不论怎样赞美也不过分的贡献”【2】!
如何将平面上的等周问题用数学公式来描述?可以假设问题中平面上的一闭合曲线用参数方程x(t)和y(t)表示。这样,曲线所围成的面积A和周长L就可以分别用积分式表示为:
等周问题要解决的就是要找到x(t)和y(t)满足的方程,使得在周长固定的条件下(L=C)面积A最大。
为了解决上述的平面等周问题,我们将首先介绍两个预备知识:一是为了求出曲线(x(t),y(t))所包围的面积而需要使用的格林定理(GreenTheorem);第二个便是当年受到欧拉高度评价的拉格朗日乘子法。
a)格林定理
牛顿和莱布尼茨对微积分贡献的精华是“微积分的基本定理”,如下面的公式(3),这个定理将互逆的微分和积分关联起来:
“微积分的基本定理”说的是什么呢?仔细看看公式(3),如果用语言来叙述它,说起来有点拗口:“一个函数F(x)的微分的积分,等于它的边界值F(a)和F(b)之差”!说些什么呀,微分又积分,不就什么也没干吗?当然和原来的函数有关啰。不过,这儿好像也玩了点儿花招,右边的结果并不完全是原来的未知函数F(x),而是被表示成了原函数的边界值。因此,换个说法,我们也可以如此来叙述公式(3):“一个变量在一段期间中无穷小变化之和,等于变量从始到终的净变化”。也许有人会耸耸肩膀,认为刚才说的都是废话,我们是学科学的,学物理的,不喜欢咬文嚼字,你干脆说说这“微积分的基本定理”有什么用处吧!
在本篇的第一节最开始介绍微积分时,谈到“微分”更符合动态和变量的观念,“积分”更是静态的。当微积分理论被建立起来之后,人们发现这个“工具”的最大优势是求积分。大家从学习经验中也能体会到:绝大多数函数的微分都不难得到,绝大多数函数的积分计算却都不容易!而在很多时候,“基本定理”便能够帮助我们计算这些困难的积分。
还要再一次将“基本定理”换一个说法。也可以这么说:公式(3)是将一个1维的积分转换成了边界上0维的积分。所以说,“基本定理”的精神也可以理解为将积分的维数降低了1阶,或许这就是用它能简化积分计算的关键所在!既然如此,我们经常会碰到多变量(例如2维)的困难积分,那么,有没有什么定理,能把平面上2维的积分转换成1维边界上的积分呢?答案是肯定的,这就是格林定理,见上面的公式(4)。因此,可以说格林定理的实质就是微积分基本定理在2维的推广。
图2:格林定理是二维的斯托克斯定理
实际上,格林定理在物理中有多种表述方式:斯托克斯定理,散度定理,高斯定理……,其实这些都可以说是同一个概念的不同名称而已。也许应用的环境和空间维数稍有不同,但它们表达的内在精神是一致的。
理解数学公式的“精神”所在很重要。现在,我们该轮到研究公式(4)及图2的精神了,首先看看公式(4):它的左边是一个在面积D上的二重积分,而右边则是一个沿着D的边界C进行的线积分。也就是说,这个式子将一个2重积分与比之低1维的线积分联系起来。一个对面积的积分怎么就变成了一个边界上的线积分?这儿如果结合一点儿物理,可以更容易理解。事实上,格林是在研究静电场和静磁场等物理问题时得到格林定理的,这个定理也能很方便地被用于流体力学的研究中。在电磁场或流体力学的具体物理情况下,函数P(x,y)和Q(x,y)可以看作是某个力的分量,而格林定理也就可以用力场的性质来描述。比如说,在力场的矢量分析中,我们可以定义矢量场的旋度和散度等等概念。如此一来,我们便可以把这些符号写进格林定理中而使它改头换面成另一种更符合某种物理内容的模样,比如散度定理。如图2右图所示,力场对面积的积分可以看作是许多无限小的圆圈线积分之和。当这些小圈线积分相加时,区域内部各个小圈积分的邻近部分因为积分方向相反而互相抵消了,最后便只剩下了边缘部分的积分(左图)。
格林定理在物理中有广泛的应用。不过,我们这儿要使用格林定理的目的,不是为了解决电磁场或流体力学的问题,而只是用它求曲线的面积而已。这只需要令公式(4)中的函数Q=x/2,P=-y/2就可以得到了。
如此而得到等周问题面积表达式(1)中的被积函数f(x,y)= (1/2)(xy’-yx’)。
另外,周长表达式(2)中的的被积函数g(x,y)= sqrt((x’)2+(y’)2)。
b)拉格朗日乘子法
历史地看,拉格朗日当年用“拉格朗日乘子法”是为了解决更为困难的变分问题。但这个方法后来在解决带约束条件的一般函数极值问题中发挥了很大的作用。为了更好地理解拉格朗日乘子法,我们逆反着这个方法的历史过程,从更简单的函数极值问题开始叙述。
图3:带约束条件函数极值问题的例子
首先举两个带约束条件函数极值问题的例子。图3a所示的小狗,就面对着爬到高处的极值问题:爬得越高,才能吃到越多的食物。如果小狗是自由的,它当然希望爬到山顶上的最高点。这是无约束条件的极值问题,“自由”便意味着小狗没有约束。但是,如果小狗被主人拴在了大柱子上,它的行动便受到了绳子长度的约束,它因此可能爬不到山坡顶,而只能爬到一定的高度。在图3a中,绿色曲线表示山坡不同高度的等高线,红色圆圈则对应于绳子给小狗的约束方程。与红线相切的那条绿线的高度,就是小狗能爬到的最大高度。
图3b所示的是一个在企业中常常会碰到的最小花费问题。比如,某公司某月要用两家不同的工厂A和B来生产90台平板电脑。这两家工厂生产不同数目(n台)电脑所给出的价格J(n)不是那么简单的线性关系。比如说,A厂给出生产n台电脑的价格JA(n)=6n2,而B厂生产n台电脑的价格JB(n)=12n2。
问题是,如何将这90台平板电脑的任务分配给两个工厂,才能达到花费最少的目的?
现在,我们将上面的任务分配抽象成数学问题。我们仍然用处理变分时所用的f(x,y)和g(x,y)来表示极值函数和约束条件。但是,需要注意的一点是:在变分问题中(公式1和2),它们不直接是欲求极值的函数和约束条件本身,而是积分号内的被积函数,积分之后的面积A及周长L才是目标函数和约束条件。而在上述这个更为简单的函数最优化问题中,f(x,y)和g(x,y)本身就是目标函数和约束条件。
如图3b所示的例子,如果该公司请A厂和B厂生产的电脑数目分别是x和y,那么,所需要的总费用则可以表示成x、y的函数。目标函数f(x,y)=6x2+12y2。所需电脑的总数目是固定的90台,因而约束条件为:g(x,y)=x+y-90=0。这样,问题可以重新被叙述为:在满足g(x,y)=0(90台)的条件下,求花费f(x,y)的最小值。
如何用拉格朗日乘子法解决这个问题呢?拉格朗日的妙招是引进一个“乘子l”,然后将约束条件和目标函数两个方程并成一个方程。也就是说,产生一个没有约束条件的新的目标函数F:
F(x,y,l) = f(x,y)-lg(x,y) = 6x2+12y2-l(x+y-90)
因为F(x,y,l)没有任何条件,便可以用一般函数求极值的方法,即分别令F对三个变量的偏微分为零。这样,就可以得到3个方程,然后则能解出:当x=60,y=30,l=720时,F(x,y,l)有极小值32400。换句话说,生产90个平板电脑最小的花费是32400元,分配方案是A厂生产60台,B厂生产30台。
从图3b可以更好地理解这个例子。图中的红色直线代表约束条件,它与目标函数的某一条等位线相切的那个点,便是问题的解。
拉氏乘子l在不同的具体问题中有其不同的物理意义。我们稍微解释一下这个例子中拉氏乘子l的意义:它是约束条件改变时,目标函数变化的最大增长率。换言之,当问题中需要生产的电脑数目不是90台而是91台(或89台)的时候,花费的最大变化是从32400元增加720元或者减少720元。
这个例子中的约束条件只有一个,但一般应用拉格朗日乘子法时,约束条件的数目可以扩展到更多。总之,拉氏乘子法的实质就是对n个约束条件引进n个乘子,产生新的不带任何约束条件的目标函数,将带约束的极值问题转换成了不附加任何条件的极值问题。
c)等周问题【3】
对变分法中的等周问题,也是引入同样的拉格朗日乘子l,将问题转换成不带约束条件的F的变分问题:
最后得到无条件的泛函F的欧拉-拉格朗日方程,再解出x(t)和y(t)后可知,它们所满足的方程是一个圆。这个问题中的拉氏乘子l,则是所得圆的曲率半径。另外,在从微分方程求解x(t)、y(t)时所得到的2个任意常数,则确定了圆心所在的位置。
参考资料:
【1】J.Steiner, Einfacher Beweis der isoperimetrischen Hauptsätze, J. reine angewMath. 18, (1838), pp. 281–296; and Gesammelte Werke Vol. 2, pp. 77–91, Reimer,Berlin, (1882).
【2】钱伟长,论拉氏乘子法及其唯一性问题,力学学报,第20卷,第4期,1988。
【3】CraigG. Fraser, “Isoperimetric Problems in the Variational Calculus of Euler andLagrange” (Historia Mathematica, February 1992, pp. 4–23).
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 13:49
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社