|||
(注:本文原载于科学网-论坛-科研经验栏目,现收集到个人博客中,更便于交流)
谈谈工科学生如何学习数学
邹谋炎
(中国科学院研究生院暑期讲座材料)
不少工科学生特别是工科研究生对数学基础不足感到压力。确实,缺乏数学的帮助会使得学生们的研究缺乏思路和工具,缺乏捕捉问题的敏感性,缺乏抽取问题本质的能力,缺乏处理问题的技巧和方法。我们许多硕士生、博士生的研究论文缺乏创新性,数学基础差是一个重要原因。这个讲座谈谈工科学生如何学习数学的问题,希望对有愿望提高数学能力的同学有所帮助。我本人是电子信息领域中的一个研究者,不是数学家,这里讲的希望能贴近工科学生的需要。作数学工作的同仁可以从这里了解到工科研究者对数学的一部分理解以及对数学家们的期望。
(一)让兴趣引导我们接近数学
有愿望学习数学,而数学内容常常不那么有趣。确实没有多少人能坚持做那些令人发困的劳作。然而,有人谈到过这样的经验:对数学的兴趣需要发掘、引导和培养。我对此很为认同。有多种方法可能增加你对数学的兴趣,当然没有一种办法可以减轻你需要付出的努力。
多做数学题是提高数学能力和兴趣的有效方法。不少成功的研究者都介绍过这个经验。如果你正在学习数学,如果你发现一道道看似困难的问题能逐渐被你解答,就表明你已经进入了良好状态。这是一个好的开端,会有克服者的喜悦,会不断发现你自己的数学才能,有继续进展的兴趣和劲头。如果你已经进入了研究工作,如果你不时抽出一点时间做一点数学趣题,对保持和提高你的数学思维活力一定有所帮助。
不少学生提出过这样的问题:是不是必须先准备了深入宽广的数学基础才适合于进入研究工作?确实,我不知道有哪个非数学专业的研究者是那样做的。而且认为那不是一个切合实际的方法。不过,准备在工科专业领域内做深入研究的学生们应当花一点时间读一点最基础的数学。除了工科大学已经教过的高等数学等课程外,可以读一点实分析和近世代数的入门知识。了解一点关于集合、测度、连续统、Lebesgue积分,以及初等数论、群这些基本概念。学习这些基本知识不需要太多的时间,而对进一步学习数学理论很有必要。对于更深入广泛的数学知识,不妨先采用“浏览学习法”:试着读一读,不太懂不要紧,但要求快一些,多一些。“浏览学习法”的目的是了解数学涉及的各个方面,为将来深入学习提供线索。不要小看那些似懂非懂的线索。如果你积累了较丰富的线索,它们会扩展你的思路,在需要的时候引导你较快地了解必须深入准备的基础。缺乏线索,脑子里要么一片空白,要么产生一些不切实际的空想,自然难以作研究工作。
结合专业研究的需要来学习深入的数学理论是一个许多研究者都很认可的方法。事实上,对专业研究题目深入思考可能激发起对数学的高度兴趣甚至产生出创新性成果。爱因斯坦的研究经历是人们知道的。在爱因斯坦研究广义相对论的早期,并非数学基础十分丰厚。在他的同学格罗斯曼的帮助下,了解了黎曼几何和张量分析。爱因斯坦在深入研究中感觉到,这种数学工具简直是为他发展广义相对论而准备的。他的工作不仅使广义相对论发展到成熟,而且推动了黎曼几何更加突飞猛进地进步。
绝非只是在物理等基础研究领域能够提出挑战性问题和发现数学的应用。在应用科学包括工程学科领域内,处处都有挑战性问题。当你试图解决某个实际问题的时候,你总会感到手头的数学不够用。尽管现代数学已经取得了十分丰富的成果,而物理世界太复杂太丰富了,当今数学能够描述和处理的问题还仅仅是一个很小的集合,而工科研究者手头的数学恐怕会更少。
从自己从事的工程学科研究中抽取数学问题是我对工科学生的一个建议。不必苦苦寻求那些被媒体追捧的“明珠”,除非你确实有准备和兴趣。你在工程学科中的已有基础是值得珍视的。这些基础有可能帮助你抽取出很有意义的理论和数学问题。而发现这些问题,除了灵感以外,最靠得住的恐怕是对专业工作的专注、勤奋而开放的思考和数学基础。
工科学生可以发挥自己在形象思维方面的长处去理解数学。如果这样,你或许会发现数学中的若干知识不仅有趣,而且有用。这里说一说几个常见的例子。
―― 正交性。这是布满了数学和物理书籍的基本知识。为什么正交函数会如此广泛地受到重视?从数学的角度看到的是基,用它来描述函数空间中任何一个元具有唯一性和可逆性;可以联系映射的定义域和值域,从而研究解乃至求得解。从应用的角度看到的是一种基本工具或方法,可以使得例如函数变换、函数逼近、数据压缩、数学物理问题的求解等问题变得容易处理和易于理解。与正交性相联系的自然是非正交性。非正交性也很有用。例如用非正交基(标架)表示信号可以灵活地具有某些特别的性质。这种表示带有一定冗余,但有一定抗损能力。
描述空间正交性最基本的数学原理是什么?合理的回答应该是Cauchy-Riemann方程。由此才有保角变换、Laplace方程、调和函数、Poisson方程等等。空间正交性对数学物理问题的研究者太有用了。有了这个直观概念,就容易理解和猜测例如流体力学、引力场、电磁场等等领域中边值问题的解的形式。例如波导中特别是在不规则波导中电磁波存在的模式、模式变化这些问题可以根据正交性来猜测和解释,因为电场分量必定垂直于波导壁,而磁场分量必须平行于波导壁。
―― 无源性。讨论无源性的数学家不多,但对于物理和工程,无源性非常重要。空间无源性隐含在解析函数的Cauchy积分定理中。事实上,例如用有限元方法处理大型力学计算问题时人们观察到,求解方程的矩阵一般是主对角优势的,这和求解一个无源电阻网络时观察到的现象相一致。其内因就是无源性,它保证了解的数值稳定性和迭代求解方法的快速收敛。在电路理论中证实,一类特别的解析函数称为正实函数作为驱动阻抗,是无源网络可综合的充分必要条件。进而,无源而且无损的网络在电子工程设计上非常有用。因为例如无源无损滤波器的特性随元件参数变化的敏感度底,适合于工业生产。现代数字滤波器包括通信滤波器组的理论和设计都要应用和发展这些概念。
―― 最大熵和最小熵。熵是热物理学中最先引入的概念,用它表示能量在系统中分布的均匀程度,同时也表示热和温度的关系。一个系统达到了热平衡,或达到了能量的均匀分布,则系统的熵达到最大。在通信领域中熵被用来作为信息的度量,表示平均信息量。如果熵最大,表明信源的不确定性最大,被传送的信号寄载的信息自然就最多。在信息处理、信号估计,包括图像处理应用中,熵的概念被借用来表示对解的先验限制:最大熵限制表示解在数值分布上应该有一定的均匀性或平滑性;而最小熵限制表示解应该很不平滑,如同若干孤立点那样。这两种情况在应用中都可能出现。例如在若干反演问题中(如信号重建、复原、去噪、估计等),为了抑制噪声,可以将最大熵作为对解的附加限制。在另外的情况下,例如希望的解是点状的星云,或者是如同若干孤立噪声那样的岩层反射序列,或者是只含一个非零元的理想信道,对这些情况就可以附加最小熵限制。注意我们这里使用的“概念被借用”说法。其实这是研究中的常用方法。如果你的视野广些,积累多些,就有可借用的机会。
―― 距离和相似性。距离这个概念在数学中太重要了,它是定义度量空间的第一要素。有了距离,才好讨论度量空间中元和元之间的相互关系,才好讨论按距离的收敛性。有多种距离的具体形式适合于研究不同的数学问题。典型的例子有用函数差值上界定义的距离(一致收敛距离)和按函数差值平方积分定义的距离(均方收敛距离)。典型地,许多问题需要通过最优化一个泛函指标来表达,这个指标就是距离。工科研究者十分关注距离的一个直观含义:函数的相似性度量。自然地,用距离描述的相似性是很窄的一类相似性。即使是这样, 它的应用已经遍及物理和工程的许多领域。与电子信息领域相关的应用例子有信号(图像)重建、恢复、估计等等。两个随机变量的在统计上是否相关或独立,或者它们的统计特性是否相似,为检验这些问题在统计学中引入了Kullback-Leibler型距离和Bhattacharyya距离(或称为差离度,divergence)。这些距离不满足三角不等式,称为广义距离。它们在统计模式分析、目标识别和分类、图像分割和配准等方面已经有重要应用。在工程研究中你可以利用手头掌握的数学不等式,定义新的距离或广义距离,它或许有某种特别的性质。
人感知物理世界,哪些事和物按什么方式和度量彼此相似,这可能是最富魅力的科学问题之一。相似这个概念既直观又抽象甚至神秘。例如绘画家可以将一个人的形象用写实画、印象画、线描画、甚至各种形态的漫画表现出来,我们可以认识他,并认为和照片上的他是同一个人。问题是如何从数学上定义这些图画中人的相似性?
如果你细心思考,数学中处处都可以发现很有趣的问题,这些问题可以在物理和工程中找到应用背景。
物理和工程学科中包含大量的数学。有的工科学习者对数学表达不经意,甚至厌烦,这种心态会妨碍知识的获得。如果你愿意花一点时间去读懂一些重要的数学表达,你会发现不仅在认识的深度上会大大不同,而且会引出乐趣甚至创新性的认识。这里不妨举一个大家熟悉的例子。卷积的表达式为y(t) =∫abx(t-τ)h(τ)dτ。我们的教科书中总是这样解说的:在每个时间点t,将x(τ)翻转为x(-τ),再平移为x(t-τ),与h(τ)乘积的结果,求面积,就得到卷积的结果。这个解说是没错的,并且因为x(τ)要被翻转,成为“卷积”这个称呼的来源。但问题是,这个解释符合物理事实吗?或者说在物理上的一个卷积过程,要求一个物理量在时间上(或空间上)必须被翻转吗?这显然不是事实!现在的问题出在哪里?问题出在刚才的解说仅仅是一个数学解说。另一种解说就没有这样的困难:将x(t)平移一个时间量τ成为x(t-τ),乘在τ处的函数值h(τ),取遍定义h(τ)的所有τ,将乘积累积起来,就得到卷积的结果。后一种解释其实是最老的解释:叠加原理。正是按照这种解释,可以构造出用物理硬件实施卷积计算的卷积器。“翻转”这个概念应该说造成了某些负面后果。例如,考虑两个外形不同的多边形(你不妨在纸上画一个任意的三角形和一个任意的四边形,假定图形内数值是1,图形外是0),这两个图形卷积后,结果是什么外形?你可以试图通过上面的两种解释从概念上得到结果。你会发现,从“翻转”解释出发会使你头痛,而从后一种解释得到结果就很直观和容易。不要小看了这里的问题,它联系着某些深入的数学:代数几何、多项式代数和分配函数理论。
另一个简单例子是矩阵的奇异值分解(SVD)。这种方法常常用于图像的特征描述、分类和识别。人们将图像离散化为数值数组,将数组作为矩阵,计算它的若干个显著的奇异值,作为描述图像特征的一组特征量。这样做合理吗?或者说,若干个显著奇异值能描述图像灰度分布特征吗?回答却是否定的。事实上,你需要仔细解读一下SVD的数学表达式。注意每对奇异向量的乘积uiviT是一个可分图像。SVD表达式表明,用若干个可分图像按奇异值进行强度加权后叠加在一起,可以逼近原图像。因此,除了几个显著奇异值外,如何描述几个显著的可分图像的特征是你可以发展的工作。
从物理和工程上解释数学是工科研究者的优势,不要忘记了这一点。我们还可以举一个抽象一点的例子。同伦是数学中的一个概念。一个拓扑流形或函数如果能够通过连续变形变成另一个拓扑流形或函数,我们就说这两个拓扑流形或函数彼此同伦。同伦论是数学中一个重要研究领域,并且与Riemann几何的研究密切关联。仅仅是同伦这个概念对工程就很有用。在大规模集成电路(VLSI)设计中需要通过电路仿真,检查设计出的电路是不是符合设计要求。一个基本的检查是要计算各个晶体管在加电后的工作点(电压和电流)。晶体管特性是非线性的,数量多,相互直流互连。直接处理这样的非线性电路问题很困难,并且可能是多解的。电路仿真程序SPICE的研究者提出了一种“源步法”,就是利用了同伦的思想。让电源电压从0开始,连续小步地逐步升到额定值,计算随之逐步迭代进行。这样在每一步,都是解一个线性化的电路问题,并且计算过程符合加电的实际物理过程。这种处理大型非线性计算问题的方法应该不限于电路计算的应用。
不同应用领域可以有关于数学概念和表达的不同解读,其实这正是数学的奥妙之处。解读数学需要耐性。如果你想把握它,就花一点时间去解读它。
(二)努力寻求数学概念的浅近解释
工科学生有形象思维的强势,但在抽象思维方面常常处于弱势。实际上,学生们进入学习多少都有这样的特点。好的教育工作者会注意这个特点。例如前苏联数学家柯尔莫哥罗夫建议讲解数学时要能用其他科学领域的例子来吸引学生,增进理解,培养理论联系实际的能力。并且要求以清楚的解释和广博的知识来吸引学生进行思维运动。柯尔莫哥罗夫的学生、数学家Arnold更是强烈地呼吁数学教育必须结合物理,充分利用几何直观,反对数学教育的非几何化和脱离物理。事实上,用物理和工程例子将数学概念形象化和具体化,达到浅近易懂,是数学家对学生(不只是工科学生)的最重要帮助。在50年代莫斯科大学组织了一批顶级的数学家写了数学普及名著“数学――它的内容、方法和意义”。直到现在,世界范围内的科学工作者中许多人都曾经或正在从该书获得入门知识。
许多学者都承认一个事实:高深理论的原始概念其实是简单的。只是不少“专著”直接从高深理论开始,忽略了对基础背景的介绍,学生接受起来就觉得抽象难懂。工科学生要想真正掌握数学理论,还不得不寻求一个具体化的或形象化理解,最好有一个物理的或工程的例子。如果得不到老师的指导,你就得准备多花一点功夫。有一些方法可以供参考。其一是尽量利用百科全书那样的工具,包括Wikipedia的网络百科,它常常可以帮助你尽可能浅近地理解基本知识。其二是多参阅几本讲述同一个理论的书或涉及该理论的文章,从中发现你可以理解的内容。如果一时难以找到很切合的参考,可以暂时放一放,不必钻牛角尖。常常,你在工程学科中的研究积累会帮助你开拓思路,甚至找到领悟的灵感。
工科学生有必要增强自信。某些数学概念内涵的神秘性其实只是我们自己的感觉而已。当然,抽象和严格是数学科学性的精髓。但这并不妨碍可以将数学概念和物理或几何直观联系起来。我们这里解说一两个例子,如有谬误请专家不吝赐教。
―― 紧集(Compact set),闭区间或有界闭集概念的拓广。“有限维闭区间”是一个易懂、易用的概念。它有一个很直观的性质,就是它在每个维上有下确界和上确界。此外,孤立点也很特别,不需要考虑它的任何“近邻”。引入“紧集”的主要动因是为了扩展有限维闭区间的概念,使得可以包含无穷维空间的点集,或者是由一类函数组成的集合。紧集的机巧定义就达到了这个目的。
紧集最有用的性质是它的有界性和可分性。这里,一个集合可分,是指存在着一个可数集合在该集中稠密。在有限维空间中,紧集的充分必要条件是有界和闭性。同时,在Hausdorff 空间中,紧集都是闭的。这含盖了分析中常用的空间,如所有的距离空间,拓扑群,和拓扑流形。在非Hausdorff空间可以构造出例子表明紧集的闭性不一定成立。
紧集的例子如:有限维闭区间;Rn中的有限个孤立点;含极限点在内的孤立有界点列集合;所有一致有界并等度连续的函数集合。在一维上的“紧支集”可以是指一个闭区间,也可以指实轴上一组有限个离散栅点。
Hausdorff空间是指符合分离公理的拓扑空间:如果集合中有两个元不相等,则它们必定有不同的邻域。细细思考一下你会发现,分离公理事实上是序列收敛性论证的基本依据:按邻域收敛,并且收敛有唯一性。
―― 拓扑(Topology),集合元素之间相互接触或连接的关系。
基本的拓扑学研究几何形体在连续变形下保持不变的性质,例如连通性。典型的问题有哥尼斯堡七桥问题,四色问题,布线平面化问题等等。
既然拓扑是指集合元素的接触或连接关系,它显然是更一般的几何性质,而不限于常规的Euclid几何性质。例如,电路拓扑图上两个节点之间有支路相连,这可以与物理连接关系一致,但与物理元件的实际空间位置不必一致。
当集合元素在某个连续域中取值时,就需要将问题放到“拓扑空间”中去研究。在拓扑空间中,常规的距离定义不一定有意义,而点列的收敛可以通过“充分小邻域”和“覆盖”这样的概念来定义和论证。一般拓扑学使用公理化方法研究连续性问题,概念变得更加抽象,并一直与微分几何、抽象代数等学科并行发展。
网络拓扑,是指网络的基本元素“顶点”和“边”的连接关系。例如用顶点来表示一个国家,两个顶点之间有边相连,表示两个国家接壤。关于网络拓扑的学科分支通常称为图论。用图论方法研究的典型数学问题有一大类组合优化问题,最优布线问题,流图分析,逻辑分析,交通流和数据流分析等等。
虽然拓扑是几何形体在连续变形下不变的性质,但在应用中发现限制形体(结构)的拓扑不变可能得不到最优解。于是希望,如果有必要,能够通过连续演化实现拓扑结构的改变。这一般地还是一个未解决问题,但也有解决得好的例子。例如希望将二维平面上的单连通区域连续地演化出多连通区域或多个单连通区域,直接在二维平面上不大好办。但如果扩充到三维,构造一个三维函数,并使用水平截集获得二维区域,就能容易地解决。这个方法已经成功地用于图像的活动围道分割等处理算法。
―― 流形(Manifold),受一定约束的某个(一维或多维)变量所有可能状态的集合。在数学文献中,流形有一个抽象的定义:流形是一类拓扑空间,其中每个点都有邻域,而这种邻域与