微积分大观园分享 http://blog.sciencenet.cn/u/skywalkon

博文

微分观点评述:莫绍揆关于微分的观点

已有 1843 次阅读 2019-7-28 12:20 |个人分类:数学观点评述|系统分类:科研笔记| 莫绍揆, 微分, 多元微分


自牛顿莱布尼茨发明微积分以来在伯努利兄弟欧拉等大数学家的推动下行之有效的微积分方法促进了整个自然科学的蓬勃发展但由于牛顿“逐渐消失的增量”的不可捉摸一会儿为零一会儿不为零受到贝克莱的责难称为消逝的量的鬼魂;贝克莱同样对莱布尼茨的无穷小量概念毫不客气,他嘲讽道,承认一个无穷小量的概念超过了“我的能力”,接受像${{(dx)}^{2}}$这样的无穷小量的无穷小部分“对任何人而言都是无限困难的”为了解决贝克莱悖论以柯西为代表的数学家抛弃了无穷小量用极限理论重新定义微分导数等概念赋予了微积分特别的严格性和精确性进入20世纪又经过康托达布和沃尔泰拉等数学家的奠基性工作勒贝格将传统微积分原理推向了新的高度自此国际数学界公认并宣布微积分原理完善

然而事实果真如此嘛

A.RobinsonK.Godel是数学界的杰出代表Godel以这种或那种形式表示的非标准分析将成为未来的分析学非标准分析的作者Robinson本书证明了Leibniz的思想能够全面维护又说有一个鲜明的对比Leibniz及其追随者给以严格的待遇而对极限学说的发起者的错误却予以谅解

莫绍揆先生是南京大学数学系的著名教授在微积分的研究方面颇有造诣尤其在微分本质的探讨上特别指出了前人的极限理论在定义微分上的本质缺陷具有重要的学术价值由于微分在积分和微分几何领域不可替代的地位莫绍揆先生尝试提出了一种新的微分定义。笔者觉得有必要介绍一下莫绍揆的试论微分的本质一文希望与在数学上具有求真和探索精神的读者一探究竟

莫绍揆先生在文中明确指出了古典的微分理论的错误这种古典的微分理论正是废除了无穷小代之以极限论的微分理论

在牛顿、莱布尼茨时代,人们把自变元$x$的无穷小增量$\theta$叫做$x$的微分,函数$f(x)$的相应的增量$f(x+\theta )-f(x)$(当舍弃了高级无穷小后)叫做$f(x)$的微分,并分别记为$dx$$df(x)$。对一元的情况还定义导数${{f}^{'}}(x)$如下:

${{f}^{'}}(x)\text{=}df(x)/dx$                    1

对多元的情况,人们仍把自变元${{x}_{i}}$的无穷小增量${{\theta }_{i}}$叫做${{x}_{i}}$的微分,记为$d{{x}_{i}}$,而函数$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$相应的增量,当舍弃了高级无穷小后,叫做$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$的微分,记为$df({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$。并推出了(事实上需假定各偏导数连续,$f$对第$i$自变元的导数下文记为${{f}_{(i)}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$,有:

$df({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=}\sum\limits_{i=1}^{n}{{{f}_{(i)}}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}})d{{x}_{i}}$      2

当人们抛弃了无穷小量代之以极限理论此时“无穷小量”$\theta $${{\theta }_{i}}$便换为有限增量$h$${{h}_{i}}$

对于一元函数人们用有限增量的比的极限来定义导数多元函数则同法定义偏导数之后人们引入微分分两种情况。对一元函数的$f(x)$,则:

         $f(x)$的微分$df(x)$${{f}^{'}}(x)h$$h$意指$x$的增量)        3

对多元函数$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$,则:$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$的微分

$df({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=}\sum\limits_{i=1}^{n}{{{f}_{(i)}}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}}){{h}_{i}}$ ${{h}_{i}}$意指${{x}_{i}}$的增量)                                          4

然而不管哪种情况我们都必须引入自变元的微分现在有两种说法

其一是“证明”$h=dx$以及${{h}_{i}}=d{{x}_{i}}$。其证明的过程如下。由$df(x)\text{=}h$,令$f(x)=x$,则$dx=h$。又由$df({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=}\sum\limits_{i=1}^{n}{{{f}_{(i)}}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}})d{{x}_{i}}$;令$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=}{{x}_{i}}$,这时${{f}_{(i)}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=1}$${{f}_{(i)}}({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=0}j\ne i$,故便得$d{{x}_{i}}={{h}_{i}}$,这样我们便推得了(1)和(2)。

另一个说法是:当$f(x)$$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$非自变元时如上定义,但当$f(x)$$x$$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$${{x}_{i}}$时,则定义为:$dx=h$$d{{x}_{i}}={{h}_{i}}$。代入上定义式便得(1)(2),显然,这个说法不是“证明”,而是用定义来保障(1)(2)的正确。

莫绍揆先生认为无论是用定义或者作出证明所得的两式即$dx=h$$d{{x}_{i}}={{h}_{i}}$都是不正确的因为人们所以要采用微分$dx$主要在于对其中的$x$可以作代入。如果$x=g(t)$ $X=G(T)$即有

                                     $df(g(t))={{f}^{'}}(g(t))dg(t)$以及

$df(G(T))=\sum\nolimits_{i}{{{f}_{i}}}(G(T))d{{g}_{i}}(T)$,(${{g}_{i}}(T)$$GT$的分量)

实践表明上面两式是正确的这两式正是微分论中重要的公式但若按照古典的微分理论是无法真正证明上面两式的,或者说这“证明”是有问题的。具体阐述如下:

例如由(1)式而获得$df(g(t))={{f}^{'}}(g(t))dg(t)$,但是由(3)得:无论$dx$$d{{x}_{i}}$,都是与$x$${{x}_{i}}$无关的量$h$${{h}_{i}}$,这时即使对$dx$$x$作代入它仍是$h$而非$dg(t)$,这是明白易见的,绝不能因为把$h$写成$dx$的有所改变。人们为什么能够“证明”呢?这是一个明显的概念混乱所致。

因为从定义(3)(4),$d$是作用于函数关系$f$之上的算子,“$df(x)$”应理解为$d$作用于$f$$df$,再作用于$x$而得它在$x$处的值。这时如果把“$f(x)$”代之以$x$,应理解为代入以恒等函数$Ix$;如果把$f({{x}_{1}},{{x}_{2}},...,{{x}_{n}})$代入以${{x}_{i}}$应理解为代入以射影函数${{I}_{ni}}({{x}_{1}},...,{{x}_{n}})$。所以我们只能得

                        $dI(x)=h$$d{{I}_{ni}}({{x}_{1}},...,{{x}_{n}})={{h}_{i}}$                    5

从而(1)式只能写为(用$X$表示矢量$({{x}_{1}},...,{{x}_{n}}$:

         $df(x)={{f}^{'}}(x)dI(x)$$df({{x}_{1}},{{x}_{2}},...,{{x}_{n}})\text{=}\sum\limits_{i=1}^{n}{{{f}_{(i)}}}(X)d{{I}_{ni}}(X)$       6

这里是$dI$作用于$x$$d{{I}_{ni}}$作用于$X$,而不是$d$作用于填式$I(x)$${{I}_{ni}}(X)$$I(x)$${{I}_{ni}}(X)$是函数填式而不是函数关系本身,它们不应是$d$的作用对象),因此绝不能从(6)中这两式作代入而得出。

在此,简单说一下,$dI(x)=h$可以简记为$dx=h$。由$x=g(t)$,我们可得:$dx=dg(t)$。但这两个$dx$不能划等号,两者$d$的作用对象不同,前者是$d$作用于$I$,而后$dI$作用于$x$后者是$d$作用函数$x=g(t)$。两者有本质的区别。前者与$x$的取值无关,只跟$x$的增量$h$有关,而$h$是一个大小可变的量。而后者只与$t$的取值和$t$的增量有关,$t$的增量是一个变量。两者表达的含义不同。因此,绝对不可以把两个$dx$等同于一个$dx$。否则,则是明显的概念混乱。

另外,有学者认为,微分是无穷小增量,而$dy={{f}^{'}}(x)\Delta x$只是近似式,要$\Delta x\to 0$时方有$dy={{f}^{'}}(x)dx$,遂认为$dx$$dy$分别是“无穷小”的$\Delta x$$\Delta y$;或者“$\Delta x\to 0$时的$\Delta x$$\Delta y$”。如陈纪修的《数学分析》(第二版)便持这样的观点。其实当$\Delta x\to 0$时显然$\Delta x\to 0$$\Delta y\to 0$,哪能得出$dx$$dy$呢?这种错误的理解也是古典理论的错误说法引起的。

最后莫绍揆先生得出结论,“说$dx=\Delta x$无论如何都是不能接受的”又说“在微分学中微分概念在理论上指自变元微分是讲不通的在使用上是没有用的甚至于会引起麻烦的”

莫绍揆先生同时讨论了多元函数的可微性并且认为多元函数微分学的内容可以根本不提到“微分”而简捷地完美地发展着

多元函数的可微性定义如下:

定义  如果存在线性函数$L$(与$X$有关)便得

$\underset{H\to 0}{\mathop{\lim }}\,(f\text{X+H})-f(X)-L(H))/\left| H \right|=0$

则说函数$fX$$X$点可微(可导)。

以前把$LH$叫做$fX$$X$点的微分,新近理论则把$L$本身叫做$fX$的微分,但$H$既非$dX$,叫做微分不妥当,应该叫做$fX$$X$点的导数,由于它又含有$H$,可叫做带参数的导数。注意在一元时,导数与带参导数均存在但不相等(后者多一因子$h$),在多元时,只有带参导数。

把$L(H)$叫做含参数的导数后通常认为多元函数微分学的内容就可以根本不提到“微分”而且这里先生还认为“在多元函数的微分学中微分概念以及微分算子d的引入不但没有必要反而会引起种种麻烦与不方便我们应废除它”

但微分概念却一直被沿用迄今从来没有人提议废除它这是什么缘故呢莫绍揆先生认为,“在别的领域例如积分学以及微分几何等),使用微分概念不但是方便的有时还是必要的不能用别的概念例如导数而简捷地代替它”

仔细考究需使用微分的地方,可以归结为对微分的两个要求:

1、当作换元$x=g(t)$$X=G(T)$时,对$dx$需作代换$dx=dg(t)$,对$d{{x}_{i}}$需作代换$d{{x}_{i}}=d{{g}_{i}}(T)$(亦即对$dX$作代换$dX=dG(T)$)。

2、如果$x$$y$间有关系$y=f(x)$,则$dy={{f}^{'}}(x)dx$,或者如果$F(x,y)=0$${{F}_{(1)}}dx+{{F}_{(2)}}dy=0$

表面看来古典的微分理论是可以推出这两个性质的从而似乎是可以接受的但是如上所述古典的微分理论并没有真正的推出这两个性质其推导实际上似是而非不能接受的)。莫绍揆先生同样指出继古典微分理论之后的近代微分理论实质与古典理论无别同样无法真正推出这两个性质

因此莫绍揆先生在文中认为我们要重新定义自变元的微分$dX$以及函数的微分$df(x)$重新发展微分论

在现有的微分理论中自变量微分的定义是很不合理的但是依变元微分的定义又是离不开自变元微分的那么有一个办法便是把自变元也看作别的变元的函数而该别的变元则从来不使用的这样我们所碰到的便都是依变元的微分了于是莫绍揆先生有了如下定义

定义  特别指定一个变元(事实上在别处永不使用)$t$$x$$t$的导数记为$dx$$X$$t$的导数记为$dX$。亦即,$dx$实即${{D}_{i}}x$,而$dX$实即${{D}_{i}}X$

通常认为自变量的微分就是其增量,依变元的微分近似于其增量,当增量越变越小时它们非常接近。换句话说,人们认为(像莱布尼茨那样):微分就是无穷小的增量。这种看法是不对的,正如莫绍揆先生所说,我们应该认为:诸微分之比近似等于相应增量之比,当增量趋于零时,两比相等。这是不难证明的。

 

 




https://blog.sciencenet.cn/blog-3396343-1191425.html

上一篇:微分大观园之北京大学篇
下一篇:微分大观园之同济大学篇
收藏 IP: 117.136.0.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 15:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部