|
凸分析理论是优化理论与方法的重要理论基础,是Optimal transport 理论的理论基础之一,也是现代经济学的数学基础的一部分。从纯数学的角度来看,从现代经济学的数学基础的角度来看,凸分析的理论算不上抽象,甚至有初等数学的感觉,翻一翻Bryan Ellickson 的Competitive Equilibrium: Theory and Applications(有中译本),王则柯、左再思、李志强的《经济学拓扑方法》(北京大学出版社,2002年出版),Nancy L. Stokey的 The Economics of Inaction: Stochastic Control Models with Fixed Costs(有中译本),就明白这一点。事实上,只要具备一定的泛函分析基础,就能学习凸分析。即便如此,对于我们这些数学能力和天赋较低的人来说,掌握凸分析的理论仍然需要下一番功夫。不下功夫,不花时间,是难以掌握凸分析理论的。
一开始,我是阅读史树中教授的《凸分析》,但是,由于泛函分析基础薄弱,对拓扑线性空间更是几乎一窍不通,第一次读这本书时,我根本没读懂,没法读懂,甚至相当排斥这本书。后来换了书,阅读冯德兴先生的《凸分析基础》,冯先生的这本书吸收了Ralph Tyrell Rockafellar 的 Convex Analysis 的处理方式,主要是在 n 维欧几里得空间中展开讨论,看起来这对泛函分析的要求不高,容易讨论凸分析的概念和理论。把冯老师的书读完了,自己感觉对凸分析的基本内容略微有所理解,但是,再读,仍然感觉雾茫茫的,很多概念、定理的本质和几何直观仍然不清晰。甚至对于在数学和力学中学过多年的 Legendre 变换的实际意义,其中的对偶含义,我都一直不理解,对于Legendre-Fenchel 变换也是如此,总觉得隔着点什么,看不清其实质。
我硬着头皮重新阅读史老师的《凸分析》,但是,我还是读不懂。仔细读史老师《凸分析》书的前言,我才感觉到必须认真学习泛函分析。花了很长时间去学习泛函分析(包括非线性泛函分析)后,我回过头来第三次再读史老师的《凸分析》,才觉得自己对凸分析真的有所了解,消除了那种雾茫茫的感觉,明白了困惑我多年的Legendre变换的含义,我甚至觉得凸分析并不是抽象的内容,同时,也喜欢上了史树中教授的这本《凸分析》。
具体时间记不准了,非常幸运,在网上淘到了署名为“重庆师范大学数学科学院重庆市研究生优质课程《凸分析与集值分析》项目组”的《凸分析讲义》电子版。这本讲义的后记是杨新民、戎卫东、梁治安三位教授写的,后记中说明了他们的讲义是对史树中教授的《凸分析》的解读、补充,这本《凸分析讲义》保留了史树中书的全部内容和讲解次序,但是,进行了改写,表述更清楚、推导详细、内容连贯,补充了很多内容和文献,是非常难得的凸分析讲义,非常有出版社价值,我一直期待该书的正式出版,但是,一直未曾见到这本讲义公开出版。
多次仔细读史老师书的前言,我才明白过来,当初读了冯老师的《凸分析基础》后,为什么感觉到对凸分析的重要概念和定理总感觉到隔了一层纱,心里总觉得不顺畅。在《凸分析》的前言中介绍写作思路时,史老师说出了他的思考和权衡,这段文字非常值得仔细回味,我们摘录在这里:
……编写凸分析面临的第一个问题是在怎样的框架中讨论凸分析。凸分析的基本研究对象是凸集和凸函数;基本工具是凸集分离定理。这些概念和定理都可以纯代数地来研究,也就是说,可在一个不引入拓扑的线性空间中来研究。因此,就凸分析的基本内容而言,凸分析完全可以表达为“凸代数”。有的数学家甚至走得更远,连线性空间的框架也被抛开,而在一个仅有抽象图形的“凸空间”中讨论凸分析。但是,过分抽象,使结果太一般,并无多大用处。较合适的框架还是拓扑线性空间,因为引进拓扑后,能使(无限维空间的)对偶空间缩小,有关对偶性的讨论就更为精确,这正是 Morean 所做的。然而,从应用的角度来看,不少人认为对于数学规划论等分支来说,有限维空间就足够了,然而对于更多的分支来说,Hilbert空间或者至多是自反的Banach空间也已足够了。因此,近年来出现的一系列有关凸分析的书往往都局限于这两种情况,也许人们认为进一步的理论基础已经由 Morean 等人奠定,为了便于入门和应用,不必深究那些更一般的问题。……为了使对凸分析有较深刻的了解,我们还是采用了象Morean采用的那样更一般的框架,即在对偶空间不大起作用时,我们在线性空间中讨论;而在对偶空间起本质作用时,我们在拓扑线性空间中讨论。
史树中教授的书出版于1990年,正如史树中先生所言,当时的情况是,一般读者难以寻觅一本合适的无限维线性空间和拓扑线性空间理论的参考书,史树中的《凸分析》概述了无限维线性空间和拓扑线性空间理论的基本内容,把涉及到的定理和命题给出了所需要的全部证明,并与凸分析的内容融为一体。史树中教授的这一处理方式和内容选择,旨在降低对读者的预备知识的要求,扩大读者群体。史老师设定的读者必备的知识是初等分析和初等集合论,但是,同时对读者的抽象逻辑推理能力要求较高。我自己学过一点泛函分析的初步知识时,第一次、第二次阅读该书仍非常困难,反复学习泛函分析后才有能力消化该书的内容。
读懂史树中教授凸分析书的时候,我才明白,由于以前自己缺乏泛函分析的知识,而有限维欧几里得空间具有自反性,原空间、对偶空间其实是同一个空间,我自己想象力不足,脑子中不能直观的建立原空间和对偶空间,仅仅局限于n维欧几里得空间讨论凸分析理论,我自己无法建立与对偶性有关的概念和定理的几何图像,不理解对偶性的含义。第三次阅读后,我觉得懂了史树中教授的书后,自己觉得再回过头来阅读冯德兴老师的《凸分析基础》,心里就感觉透彻多了。
一句话,对于我们这些数学基础薄弱、数学逻辑推理能力理解能力较低的人来说,只有在拓扑线性空间(或者更窄一些赋范线性空间、Hilbert空间)中讨论明白凸分析的基本理论,我们才能对凸分析理论理解的更透彻。有了这样的基础后,再回到有限维实数欧几里得空间中,对在这一空间涉及到对偶问题的很多概念和定理才能形成清晰的几何直观图像。
2000年出版的、胡毓达与孟志青二位教授合著的《凸分析与非光滑分析》是另外一本依托拓扑线性空间的框架讨论凸分析(以及集值映射)的著作,这也是一本很出色凸分析中文著作,该书逻辑思路清晰,内容流畅、概念和定理表述严谨而又易懂,非常适合初学者学习。(我工作的学校图书馆并没有这本书,学校图书馆这类书很少(当然,也没有史树中的书,甚至都很少购进这类书)。国家图书馆有这本书,我最后一次借阅时,国图的人员说该书损坏太严重了,要重新装订补修,就不再允许借阅了。已经六七年过去了,一个月前国图还没完成装订。)
讨论优化理论的空间框架也有类似情况。局限于有限维实数欧几里得空间讨论优化方法,基本上能满足应用学科、应用研究的需要,对于面向工程技术和社会科学领域的工程技术和研究人员所用到的已有的优化方法,基本上都可以在有限维实数欧几里得空间中介绍。这就是为什么 Stephen, Boyd & Lieven, Vandenberghe的 Convex Optimization,Dimitri P. Bertsekas 的凸优化理论、凸优化算法、非线性规划,以及 Luenberger David G. 的线性与非线性规划,都是在欧几里得空间中展开讨论的。但是,我个人的体验跟学凸分析一样:对于泛函分析基础薄弱的非数学专业的人来说,要透彻理解优化方法,需要在抽象的空间(Hilbert 空间或者Banach 空间)讨论清楚优化理论的基本原理,然后再回到有限维实数欧几里得空间讨论即可。我猜想,这也就是为什么诺贝尔经济学奖得主、经济学家萨金特和一批伟大的经济学家都认为自己是通过 Luenberger, David G. 的 Optimization by Vector Space Methods 理解了优化方法(这本书在1987年出版过中译本,中文书名《最优化的矢量空间方法》,译者是蒋正新、郑梅春),这也是萨金特唯独把这本优化著作视为优化理论的圣经的原因。
面向具有深厚泛函分析修养的数学专业人士和研究生优化理论教材,例如袁亚湘院士、孙文瑜教授合著的《最优化理论与方法》,也主要在有限维欧几里得空间中讨论优化理论和方法。但是,我相信,这部分读者群体学习完袁亚湘、孙文瑜合著的《最优化理论与方法》后对优化理论与方法的理解掌握,与没有掌握多少泛函分析知识的非数学专业人士学习 Stephen, Boyd & Lieven, Vandenberghe的 Convex Optimization 或者Dimitri P. Bertsekas 的凸优化理论后的理解、把握,这是相距甚远的两个层次。这个差距是由于泛函分析知识和其他数学基础的差距造成的。
凸分析的著作往往也多涉及一些优化理论和方法,凸优化理论和方法的著作当然必须讨论凸分析理论,但是更侧重于优化理论和方法。最近二十几年来,我国出版了很多中文版本的凸优化理论和方法著作;最近几年,凸分析理论也有几本很出色的著作出版了。李庆娜教授的三卷本《凸分析讲义》,刘歆、刘亚锋的《凸分析》,杨新民、孟志青的《凸分析基础》,张立卫、唐立新的《凸分析》(刚刚看到出版信息,没读过)。李庆娜教授的三卷本《凸分析讲义》尤其适合学习阅读,对于我们这样的非数学专业的人来说,一口气把Ralph Tyrell Rockafellar的 Convex Analysis(有中译本)读完,是很难的,这需要巨大的耐心和毅力,需要充分的时间保障。我们很难持续保持兴趣一口气读完这本著作。而李庆娜的三卷本《凸分析讲义》则把这些内容,进行了分解,可以分期地完整学习完凸分析的主要内容,而且该书对有关的证明进行了补充讲解,是非常好的教科书。刘歆、刘亚锋的《凸分析》重点突出,内容精炼,简明扼要,非常适合作为教材。
Ralph Tyrell Rockafellar的Convex Analysis,Stephen,Boyd & Lieven, Vandenberghe的Convex Optimization ,Dimitri P. Bertsekas 的凸优化理论、凸优化算法、非线性规划以及国内最近二十年出版的凸分析、凸优化著作,这些著作不能完全替代在更一般的抽象空间中讨论凸分析和优化理论的著作,史书中教授的《凸分析》,胡毓达与孟志青的《凸分析与非光滑分析》,C. Zalinescu 的 C onvex Analysis in General Vector Spaces,以及 Viorel Barbu, & Teodor Precupanu 的 Convexity and Optimization in Banach Spaces, 对于深刻理解相关理论的仍然是必须阅读的材料,尤其是对于泛函分析知识薄弱的人来说,更是如此
Optimal transport理论作为一个数学分支,在过去几十年中非常活跃、进展迅速,Cédric Villani和Alessio Figalli分别因为这一领域的研究成就而获得2010和2018年菲尔茨奖。Optimal transport理论也初步展现出了广阔的应用前景,社会科学研究者,也需要掌握这一数学工具。在哪类空间中展开讨论,更有利于非数学专业的人理解Optimal transport理论、掌握其核心内容?目前主要有两种空间,一是n维欧几里得空间,第二种是Polish空间(完备的、可分的、度量空间),也有在其它抽象空间上,在流形上讨论输运理论的。抽象的可测空间上,未必有拓扑结构,难以满足实际需要。n维欧几里得空间过于理想,往往会淹没很多问题的本质,不容看出问题的根本规律。最优输运理论(最优传输理论)的很多问题中,源空间和目标空间很可能不能有线性结构,这种情况下无法通过在n维欧几里得空间的讨论解决问题。Polish空间有可测结构,有拓扑(有距离)结构,可以有或没有线性结构,很多情况下更逼近实际情况,是非常合适的分析框架。向非数学专业、社会科学领域的学者、学生介绍Optimal transport理论,可以在在Polish空间中展开讨论。
对于从科学的角度来探讨教育、经济以及社会领域的规律的学者来说,数学无疑是最重要的理论研究工具。泛函分析、微分方程、凸分析、微分几何、测度论、高等概率论……,这可能都是研究社会科学需要具备的基础知识。掌握一定的数学理论,需要花时间。即便对于数学专业的人士来说,掌握一定的数学理论也是需要付出巨大时间成本的。对于多数从事社会科学研究的人来说,我们并不具备特殊的数学天赋和能力,数学是多数人并不擅长的,但是,我们恰恰妄想用极其少的时间就迅速掌握研究中所需要的数学理论和方法,这是异想天开,决不可能做到的。要想真的做好社会科学研究,要有耐心,舍得花费足够多的时间,吸收学习现代数学知识,掌握相应的数学工具,这是一件必须做到的事情。踏踏实实地做研究才有可能跟学术沾边!功利化的“做研究”,甚至胡编乱造,不可能有真正的学术研究,那是丧尽学术良心的、坑国害民的、恶劣渔利行为。
同时,期待数学家、广大的数学专业的学者,多花些时间、多动脑子花心思写出一些适合非数学专业的人阅读的现代数学著作,这也是推动我国学术研究进步的重要环节。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-21 20:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社