||
【编者按:薛问天先生针对师教民先生的疑惑和莫绍揆教授等的置疑,专门写了这篇文章。他澄清了对「微分」这个概念的确切理解,指出迷惑了不少学者 的所谓「微分迷团」,实际上是由于对数学分析中的微分概念的误解所引起的,从而完满地解答了这些疑问。薛问天先生的文章选自《学术争议问题评论园地》易323(2018-04-12)。】
解开「微分迷团」,
兼评师教民先生的疑惑和莫绍揆教授等的置疑。
薛问天
摘要
由于对数学分析中「微分」概念的误解,特别是对用记号dy(或dx)在不同场合下代表的不同变量认识不请,导致有些学者产生了概念混乱的「微分迷团」,对自变量的微分的定义dx=Δx迷感不解。甚至有人据此对微积分的理论产生了质疑,认为其中有矛盾,有悖论,有错误。本文对此作了深入细致的分析,解开了「微分迷团」,全面解答了对微积分理论的疑惑和置疑。
目次
1)引言。
2)什么是「微分迷团」,如何解开迷团。
3)变量的增量。
4)微分的定义。
5)函数(因变量)的微分同自变量的微分的区别。
6)微分定义的三大要素。
7)微分记号表示的不同变量。
8)对微分记号的标注。
9)复合函数微分的「形式不变性」。
10)解开师教民老师的疑惑。
11)评莫绍揆教授的质疑。
1) 引言
由于对数学分析中的微分概念的误解所产生的「微分迷团」迷惑了不少学者。他们没有认清在微分定义中,「函数f在x0点的微分」同「自变量的微分」是分别定义的两个不同的概念。混淆了两者的区别,从而对自变量的微分dx=Δx产生了怀疑,并以此对微积分理论提出了质疑,认为微积分理论出了错误,出了矛盾,产生了「悖论」等。
「微分迷困」确实有一定的迷惑性,在部分业界也有一定的影响。师教民老师是一名大学教师,他写给某院士的一封信【1】中说【我己经请教过的上百名大专家都回答不了我请教的问题。形成了学生把老师问得张口结舌,老师把专家问得无言以对的尴尬局面,而使微积分的教学无法真正进行下去!】。
我国著名的数理逻辑大师莫绍揆教授在南京大学学报上发表文章,明确质疑自变量微分的定义【2】:【无论是用定义或者作出"证明",所得的两式即dx=h,dxi=hi,都是不正确的,是不成立的。】【我们的结论是:说dx=Δx,无论如何都是不能接受的。】
姜赞臣先生说【3】:【数学分析中最基本的矛盾是由等式dx=Δx反映的。它实际上应该是数学分析中的悖论。】
沈卫国先生也认为:【微分最主要的问题是dx=Δx的问题。】
那么什么是「微分迷团」,它为什么有这么大的迷惑性,如何解开此迷团,为什么说这是由对微分概念的误解产生的。怎样正确地理解微分概念的确切定义。本文将逐一具体分析解释,解开此迷团。
2) 什么是「微分迷团」,如何解开迷团?
所谓的「微分迷团」,就是对函数的自变量的微分定义dx=Δx产生的疑惑。因为对复合函数y=f(x),x=g(t)来说,函数x=g(t)的微分dx是Δx的一部分(线性主部),显然dx不等于Δx:dx≠Δx。然而在微分的定义中是把自变量的微分dx定义为等于Δx的,即dx=Δx。于是以为这是矛盾,dx等于Δx同dx不等于Δx产生的矛盾。
其实,要解开这个迷团是很简单的。因为这两个dx,虽然都用记号dx表示,前者是函数y=f(x)的【自变量的微分】,后者是【函数x=g(t)在t0点的微分】。它们根本就是两个不同的变量,此dx非彼dx,自然不相等。发现它们不相等很正常,这里没有任何矛盾。之所以产生矛盾是由于对微分概念的误解,把两个不同的变量误以为是同一个变量而产生的。
要对此认识清楚,还需对微分的定义仔细分析,澄清对微分概念的认识和理解。
3)变量的增量。
什么是微分?直观地讲,「微分是变量增量的一部分」。究竟什么是增量,微分是增量的哪一部分。让我们慢慢来分析。
设有函数y=f(x),x是自变量,y是因变量。当自变量x在x0点有一个增量Δx(>0)时,因变量y也相应地有个增量Δy。这个增量定义为:
Δy=f(x0+Δx)-f(x0)。
显然,从此定义式可以看出,因变量增量Δy的值是随Δx而变的,即Δx确定后,Δy就确定了。而且Δy的值与函数f有关以及与点x0有关。当f换成另外的函数,或者函数不变而x0换成另外的点时,Δy的值也会发生变化。而Δx是原始的增量,他不随函数f及点x0的不同而变化。
对于复合函数h=fog的情况,即y=f(x),x=g(t),y=h(t)=f(g(t))。由于x0=g(t0),Δx=g(t0+Δt)-g(t0),从而x0+Δx=g(t0+Δt)。于是函数f在x0的增量Δy=f(x0+Δx)-f(x0)=f(g(t0+Δt))-f(g(t0))=h(t0+Δt)-h(t0)。即它等于函数h在t0点的增量。也就是说在复合函数的情况下,Δx已经不是原始增量,Δy和Δx都是由Δt确定的。求Δy时,无论用x作为中间变量,先求出Δx再来求Δy,或直接用函数h来求,都符合增量的定义公式,所求出的Δy是相同的、确定的。这就是所谓「复合函数增量的一致性」。
4)微分的定义。
上面说「微分是增量的一部分」,究竟是哪一部分呢?直观讲:「自变量的微分是变量增量的全部,因变量的微分是变量增量的线性主部」。微分的确切定义是这样定义的:
【定义(微分)】。对于函数y=f(x),如果变量增量Δy=AΔx+o(Δx),则把AΔx,称为【函数f在x0点的微分】,记作dy=AΔx。把Δx称为【自变量的微分】,记作dx=Δx。
上面己讲过,定义中Δx是自变量的增量,Δy是函数f在x0点,相应于Δx的函数(因变量)的增量,即Δy=f(x0+Δx)-f(x0)。
由于Δy的表达式中,AΔx是Δx的线性函数,o(Δx)是Δx的高阶无穷小,也称dy=AΔx是Δy的线性主部。关于线性和主部有严格的数学定义,微分的线性和主部这两个特性是缺一不可的。详见《谈「主部」和「线性主部」》一文(《学术争议问题评论园地》易319。)
关于微分概念的定义,以下几个关键问题是需要特别强调的。
5)函数(因变量)的微分同自变量的微分的区别。
从微分的定义可知,这里的dy=AΔx是【函数y=f(x)在x0点的微分】(我们也把它简称为【函数(因变量)的微分】),dx=Δx是函数y=f(x)的【自变量的微分】。这是分別定义的两个不同的概念,不容混淆。
在上述定义中,【自变量的微分】直接定义为dx=Δx,不过在有些书中把自变量的微分dx定义为等值函数Ⅰ的【函数(因变量)的微分】(等值函数是一个特殊的函数,对任何x有:Ⅰ(x)=x。)由于可证对于等值函数Ⅰ,函数增量的线性主部就等于Δx(即相应的线性系数A=1),所以可证这两种关于自变量微分的定义是等价的,都有dx=Δx的结果。
6)微分定义的三大要素。
从微分的定义可知,微分dy,dx这个概念,不仅同变量y、x等有关,而且还同函数有关,同变量在函数中的作用和地位有关。必须从概念上弄清它包含的三大要素。
第一个要素。首先要分辨该微分是【函数(因变量)的微分】还是函数【自变量的微分】。
如果是【函数(因变量)的微分】,那么还要考虑下面两个要素。
第二个要素。是哪个函数(是f,g还是h等其它函数)的微分。
第三个要素。是在哪个点的微分。
要知道这三大要素只要有一个要素不同,所定义的微分变量就是不同的变量。对于自变量的微分可以不考虑第二和第三要素,因为任何函数在任何点的自变量微分都等于自变量的增量,都一样。但是对于函数的微分dy来说,不同的函数定义不同的微分变量,既使函数相同在不同的点定义的微分变量也是不同的。
例如,假设有y=f(x),x=g(t),复合函数y=h(t)=f(g(t))。
令函数y=f(x)在x0点的微分dy=Adx,,,,,,①,
函数x=g(t)在t0点的微分dx=Bdt,,,,,,②,
而y=h(t)在t0点的微分dy=Cdt,,,,,③。
显然①式中的dx同②式中的dx是不同的微分变量(第一要素不同)。即①中的dx 是函数y=f(x)的【自变量的微分】,②中的dx是【函数x=g(t)在t0点的微分】,这两个dx是不相等的。
这里需要特别注意的是,对于增量系统而言,当x作为自变量时的Δx同当x作为函数x=g(t)时的增量Δx是相等的,一致的。但是对于微分系统而言,dx是自变量微分同dx是函数x=g(t)的微分是两个不同的微分变量,前者等于Δx,而后者只是它的一部分(线性主部),并不等于Δx,是不一致的。
同时,还应看到①式中的dy同③式中的dy也是不同的微分变量(第二要素不同)。前者是函数y=f(x)在x0点的微分,后者是函数y=h(t)在t0点的微分。可以具体证明它们是数值上并不相等的微分变量。有些人往往忽视了这点不同,而隐含了不应有的混乱。
7)微分记号表示不同的变量。
当我们分析了微分的定义,全面正确地理解了微分概念的确切含义以后,就会发现原来用同样的记号dy,dx在不同场合,不同公式中(甚至在同一公式的不同地方)所表达的微分变量,是不同的变量。所以我们在学习和理解,运用这些微分公式时,一定要根据定义和上下文来具体分辨和确认微分的三要素的內容,来确定它代表的是哪个微分变量,不能混淆。不要以为各处的dx,代表的都是一个变量。因为dy,dx这只是一个简单的记号,它不可能携带该微分变量的全部信息(三要素)。而是要读者根据上下文来分辨确定。只要认识清楚,概念清晰,是不会产生混乱的。
8)对微分记号的标汪。
虽然都是用相同的记号dx,dy表示,但是从定义和上下文可以分辨出它们是不同的变量。这些区别,都是隐含着的。
为了学习和理解以及论述方便,我们可以提供一种对微分进行标注的方法,把隐含的三大要素明确地标注清楚,这样可以有利于理解和论述。标注方法很简单,如果dx是自变量的微分,就标注为dx[Ⅰ],如果是函数x=g(t)在t0点的微分就标注为dx[g,t0]。
例如前面的①②③就可标注为:
dy[f,x0]=A dx[Ⅰ],,,,,①,
dx[g,t0]=B dt[Ⅰ],,,,,②,
dy[h,t0]=C dt[Ⅰ],,,,,③。
这样标注以后,就可明显地看出①式中的dx同②式中的dx是不同的变量,①式中的dy同③式中的dy也是不同的变量。
我再强调一下,这个标注只是为了理解和论述方便,从专业角度来讲并无标注的必要,从上下文即可区别。只不过是隐含的而己。
当然,如果沈先生硬要坚持【一个符号,只能表示一个东西】的原则,完全可以用上述带标注的微分记号把微积分改写一遍。这样按照要求改写以后的微积分,不同的对象用不同的符号表示,还能认为它有矛盾吗?还有悖论存在吗?
问题是这种改写完全没有必要。根据前后文,根据论述的內容完全可以分辨出其中的dx,dy所指的变量的确定类型和内容。只要认识清楚,并不会引起混乱,产生矛盾。只有误读,认为凡是dx,就是相同的变量才会产生矛盾。
9)复合函数「微分的形式不变性」。
在微积分中。有个有趣的规律叫「微分的形式不变性」。
在复合函数的情形。设有y=f(x),x=g(t),从而复合函数y=h(t)=f(g(t))。令函数f的微分dy[f,x0]=Adx[Ⅰ]①,函数g的微分dx[g,t0]=Bdt[Ⅰ]②,而h的微分dy[h,t0]=Cdt[Ⅰ]③。上面己经分析,①式中的dy同③式中的dy是不同的变量,①式中的dx同②式中的dx也是不同的变量(区别见微分的标注)。由于对于复合函数,可证它们的导数具有关系:C=AB。于是有dy[h,t0]=ABdt[Ⅰ]。但是因有dx[g,t0]=Bdt[Ⅰ],所以有dy[h,t0]=Adx[g,t0]④。注意这里④式中的dy是函数h的微分,dx是函数g的微分,这同①式中的dy(函数f的微分)和dx(f的自变量的微分)是不同的变量。但是①式和④式在形式上是完全相同的,都表示成dy=Adx。这就叫作「微分的形式不变性」。也就是说在式子dy=Adx中,你可以把它解释为「dy是函数f的微分,而且dx是f的自变量的微分」,也可以解释为「dy是函数h的微分,而且dx是函数h的微分」。这都没有错。(注。请注意解释中的【而且】两个字。也就是说,解释是dy、dx配对的,不能单独把dy作这种解释,而dx又作另种解释。)
有些人不理解其中的区别,把这种「形式的不变性」误以为是等量的「替换」或「代入」。而实际上dy[f,x0]并不等于dy[h,t0],dx[Ⅰ]也不等于dx[g,t0],于是就错误地以为这是数学分析中的矛盾。其实只要概念清晰,理解正确,这里沒有矛盾,也不是等量的替换和代入,而是刚好有这样的形式规律而己。其实微积分理论中之所以把它称为「形式不变性」,就是指它们只是「形式」上的相同,实际的变量是不同的,不是相等变量的替换和代入。
10)解开师教民老师的疑惑
有了上述论述和解释后,我想师教民老师的疑惑应该迎刃而解了。
师老师信中引述的理论,所说的关于自变量的微分的两项【规定】,实际上就是关于自变量微分的两种定义方法。一种是直接定义dx=Δx,另一种是把自变量的微分定义为等值函数Ⅰ(x)=x(即函数y=x)的函数(因变量)的微分。
从行文中可以看出,师先生对【没有证明的"规定"】还不甚理解,其实这里的规定就是对【自变量的微分】这个数学概念的定义。定义同定理不同,定义并不需要证明。而所引述的证明,并不是对【自变量的微分】的定义正确性的证明,而是证明这两种不同的定义方法的等价性。最后都等价于把自变量的微分定义为dx=Δx(即所引公式⑷)。
我们前面己经指出,dx作为【自变量的微分】,同dx作为函数x=g(t)的【函数(因变量)的微分】本来就不是一个变量,就不一定相等。师老师在他信中所举的例子就是要说明它们不相等。理论上就不是相同的变量,举个例子证明它们不相等,不说明任何问题。不相等这是理所当然的事,一点矛盾都没有,哪里有什么【错误】。
例如第一个例子。y=√x,它的反函数是x=y^2。当dx是函数的【自变量的微分】时,dx=Δx。当dx是函数x=y^2的【函数(因变量)的微分】时,dx=2yΔy,它当然不等于Δx。这是两个不同的dx,按照微分的定义就不是一个变量。按照上下文用我们对微分记号的标注,它们分别是dx[Ⅰ],和dx[y^2,y]。它们不相等是理所当然的事。
第二个例子,y=f(x),它的反函数是x=g(y),如果对微分进行标注,师先生推出的式子是
dy[f,x0]dx[g,y0]=ΔyΔx。
这是一个非常有趣的公式。由于自变量的微分dy[Ⅰ]=Δy,dx[Ⅰ]=Δx,这个式子也可以写为
dy[f,x0]dx[g,y0]=dy[Ⅰ]dx[Ⅰ]。
这里不仅一点矛盾都没有,而且正好是反映了f和g互为反函数时,它们的几个微分变量之间的正确关系。师先生之所以认为它有矛盾,主要是混淆了【自变量的微分】同【函数(因变量)的微分】两个不同微分变量的区别。
所以说,这里产生的矛盾并不存在。并不像师先生所述那样,【进一步敲定了】微积分的理论出现错误,而是师先生混淆了微分的基本概念,在对微分概念的理解上出现了错误。
11) 评莫绍揆教授的质疑。
莫绍揆教授也是被「微分迷团」所迷惑的学者之一。他的特点是:他认识到作为自变量的微分同作为函数的微分是不同的变量。但是他却要坚持允许这些不同变量之间的「替换」,即所谓的「代入」。要知道只有相等的变量才能作这样的代入。不相等的变量不能作这样的替换。由此产生的矛盾,他解释不了,从而产生迷惑。他的质疑的核心错误就在这里。
莫先生说:【人们所从要采用微分dx主要在于对其中的x作代入,】
所以他认为,既然知df(x)=f’(x)dx,x=g(t),将x代入x=g(t)后【而获得df(g(t))=f′(g(t))dg(t)】。于是他想不通,如果把dx作为自变量的微分定义为h的话,dx是无论如诃【而非d(g(t),这是明白易见的。】于是莫绍揆教授产生了了迷惑。
也就是说,莫先生的错误在于认为如果变量x=g(t),微分dx中的变量x可以代入得出dx=dg(t)。错误地以为微分dx就等于dg(t)。他的错误就在于以为变量相同,微分就相同。其实按微分的定义,微分除变量外,还有三大要素①是自变量微分还是函数的微分?如果是函数的微分,还有第二要素,②是哪个函数的微分?第三要素,③是在哪个点的微分?只要有一个要素不同,所定义的微分就是不同的微分变量。
至于微分有「形式不变性」。即dy=Adx这个式子中,可以解释为「dy为函数f在x0奌的微分,而且dx为自变量的微分。」也可以解释为「αy为复合函数h(t)=f(g(t))在t0点的微分,而且dx是函数g(t)在t0点的微分。」
之所以能作这两种不同的解释,我在前面己讲过,这是由于严格地证明了微分的「形式不变性」这个定理所致,並不是相等变量的「替换」和「代入」。这点是莫先生对微分原理的误读。
另外,我们注意到莫先生对自变量x的微分仍用记号dx表示,但对函数y=f(x)的微分,用的记号不是dy,而是df(x)。这样的记号体系,在区别函数的微分与自变量的微分方面本来有一定的好处。但是莫先生却允许在复合函数的情况下,进行x=g(t)的代入,反倒引起了混乱。亦即莫先生允许代入后有等式:df(x)=df(g(t))和dx=dg(t)。这两个式子实际上是错误的,因为df(x)表示的是函数f在x0点的微分,而df(g(t))表示的是复合函数h(t)=f(g(t))在t0的微分。这是两个不同的变量,数值并不相等。dx是自变量的微分等于Δx,而dg(t)是函数g在t0的微分,它是Δx的线性主部,并不等于Δx。莫先生用这样的微分记号,并允许其中的x作代入替换,实际上是混淆了微分概念的确切含义,造成了微分概念的混乱。这是在微积分理论的理解与表述中的严重错误。
12) 结论。
综上所述,「微分迷团」是由于对微分概念的误解所产生的概念混乱。误以为对一个变量而言,就只有一个微分变量。其实这是对微分概念的错误理解。微分不仅同变量有关,还同函数有关,还同此变量在函数中的地位有关。例如对变量x而言,微分dx是【自变量的微分】,同dx是【函数x=g(t)在t0点的微分】就是不同的变量,而且对不同的函数,不同的点,这些徵分变量都是不同的。有些人误以为这些微分都是相同的,在发现事实上并不相同后,就迷惑了,就以为微积分理论出了问题,出了矛盾。甚至认为这是悖论,是理论上的错误。
另外,有些人对复合函数的「微分的形式不变性」缺乏正确认识,把「形式」上的相同,误以为是相同变量的「替换」和「代入」,这也是产生迷惑的原因之一。
其实只要澄清了对微分概念的理解,认识到这本来就不是相同的微分变量,认识到「形式不变性」实际上不是相同变量的替换,「微分迷团」就会迎刃而解,烟消云散。就会认识到所有的这些质疑都不成立,微积分的理论在微分概念的定义上并没有矛盾,并没有错,是完全正确的。
参孝资料:
[1]。师教民:一封关于数学分析中「微分」概念问题的信件。《学术争议问题评论园地》易321,2018年3用30日。
[2]。莫绍揆:试论微分的本质。《南京大学学报》第30卷第3期,1994年7月。(亦见《学术争议问题评论园地》易322。)
[3]。姜赞臣:从标准分析中的悖论看非标准分析的必然性。《淄博师专学报》1994年6月,第二期。(亦见《学术争议问题评论园地》易317。)
附:师教民先生的一封信。
附:莫绍揆教授文章部分内容摘录:
............
..............
返回到:
zmn-000文清慧:发扬啄木鸟精神-《数学啄木鸟专栏》开场白及目录
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 08:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社