|
图1. 纽约大都会博物馆,武器甲胄展厅。
几天前,老顾陪大连来的友人参观了位于曼哈顿的纽约大都会博物馆。博物馆的武器甲胄展馆举世闻名。展厅中央一队重甲骑士,金戈铁马,豪气干云。武士全身披覆凯甲,精钢打造,寒光耀眼,脸罩面具,只留一条狭长眼线,造型奇诡,肃杀冷酷,摄魂夺魄。令人不禁想起李白的《侠客行》:
赵客缦胡缨,吴钩霜雪明。
银鞍照白马,飒沓如流星。
十步杀一人,千里不留行。
事了拂衣去,深藏身与名。
馆内展览了大量的冷兵器,从青铜战戟,到大马士革弯刀,到各色欧洲中世纪的重剑,花剑。满厅杀机千重,剑气森然,许多古剑利刃崩卷,血槽暗黑。联想到刀剑背后的血腥历史,令人激越亢奋,血脉贲张。
图2. 纽约大都会博物馆,武器甲胄展厅。(李贵年摄)
仔细观察这些甲胄,就会发现其内在工艺极其繁琐复杂,各种铸锻造型,铆钉衔接,关节自由度设计,金银浮雕纹饰,无一不饱含匠心。许多胸甲,在心脏表面镶嵌一个梭镖,和盔甲垂直,想必用于最后的肉搏。侧室陈列着各色十字弩机和火铳。和耀武扬威的铠甲重剑相比,火铳粗糙低劣,形制原始。但是,历史早已表明,就是粗陋的火铳彻底地粉碎了精英的骑士阶层。
军事一直是科技发展的源动力之一。一项关键技术的掌握与否决定了一个民族和国家的生死存亡,因此在军事上的科学研究往往会超越经济的考量,科技上的突破也往往最先在军事上得以实践和应用。前些时候和机械系的陈教授探讨合作项目,陈教授介绍了一种新型材料-负泊松比材料。这种材料在自然界中并不存在,它的微观几何结构使得它具有非常独特的力学特性:当受力时,材料会向受力点集中,受力点的密度会急剧增加。因此负泊松比材料被认为是现代铠甲的最佳材料选择。陈教授也非常看好三维打印技术,他认为三维打印技术为机械设计空间提供了崭新的维度,其前途不可限量。这星期在访问大连理工大学,这里有全国最大的三维打印机。其缔造者姚山教授数十年来专注于铸造的数值模拟,他终生最大的梦想就是能够制造铜制七叶螺旋桨,这是潜艇静音技术的关键。
参观博物馆可以使人回顾历史,并从历史中得到启迪。每年访问国内的学术界,老顾能够清晰地感受到历史发展的步伐。几年前,国内计算机学术界非常重视论文的数量;近几年来,依随国内学术论文井喷式的发展,国际计算机学术界的格局正在发生巨大变革。许多期刊的稿件来源几乎被国内学者所垄断,国际评审委员会依然被西方学者所把持,评委们感受到日益增加的压力,却又不愿放弃其垄断地位。亚洲不同领域的学者们组织成规模庞大的民间团体,用严密的组织形式提出自己的述求,同时培植自身的权威期刊。从另外一个角度而言,亚洲学者不再满足于简单的计数文章篇数,而是日益重视文章的引用。这是研究质量提升的一个明显标志。多年以来,老顾和欧美的学者交流时,他们的一个观点是国内的学者论文很多,但是主要是追随西方的潮流,没有自己独立的流派,难以赢得别人的尊重。相信在下一个历史阶段,我们会看到亚洲学者会创立新的领域,引领新的方向。
大连理工大学软件学院的罗钟铉院长和老顾有着长期的合作。罗教授及其研究小组在研究样条空间奇异性的问题时,利用对偶原理发现并证明了新的射影不变量—特征数,该不变量能够揭示代数曲线及超曲面的内蕴几何性质。我们正在将这一理论系统地向流形推广。罗教授对于治学有精辟的评价,提出了所谓的“三新理论”。他认为做学问有三个层次:“最高层次是创立新的领域,其次是洞察到新的视角,最后是发明新的方法。” 比如提到计算机代数领域,大家就会想到吴文俊先生;提到数值代数的同伦延拓算法,大家就会想到李天岩先生。对于求解多项式方程组这一基本问题,吴文俊先生发明的吴方法是基于代数几何的符号计算方法,其所得解是精确的,但是计算复杂度很高;李先生发明的同伦算法是基于微分拓扑的数值计算方法,其所得解是近似的,但是计算复杂度较低。再如,为了解决庞加莱猜测,不同的流派根据不同的视角,提出了不同的方法:瑟斯顿(Thurston)学派大量应用Teichmuller理论,曲面映射类群的分析等拓扑方法;丘成桐学派主要应用几何分析理论。两个流派都为这一猜测的证明做出了不可磨灭的贡献,最终的证明是Hamilton发明的几何分析中的Ricci 流方法。从历史来看,在几何分析流派内部,人们也尝试了多种方法。丘成桐先生曾经力图用极小曲面理论来证明有关这一猜测的关键定理。
那一刻,被寒光凛冽的重甲古剑围绕,老顾久久地思索这样一个问题:如何才能说服自己,我是在用生命打造一把粗陋的火铳,而不是为一把华美的重剑雕琢上繁复的鎏金纹饰?
这一星期,老顾访问大连理工大学,在软件学院和数学学院给出了一系列的讲座。由于时间过于仓促,许多细节没有充分解释。在此,老顾将讲座内容详尽写出,希望有助于学生们进一步理解这些理论和算法。讲座内容较多,我们分几次逐一阐述。
直接应用 在计算机视觉领域,和几何大数据分析领域,几何数据聚类问题具有根本的重要性。如图3所示,我们采集了一些带有表情的三维人脸数据,9个人,每个人有三种表情:悲伤,欢喜和惊讶。我们的目的是设计一种自动的算法,让计算机将这27张人脸,在没有人工干预的情况下,分成三类,每一类对应一种表情。
图3. 三维人脸表情识别。
一种普适的想法是在三维人脸曲面间定义一种几何距离,这种距离衡量了不同形状之间几何的相异程度。这样,我们计算任意一对人脸曲面间的距离。然后,我们把每一张脸抽象成一个点,将这27个点嵌在欧式平面上,使得每对点之间的欧式距离尽量接近对应的两张人脸曲面间的几何距离。如果人脸曲面间的几何距离选取得当,那么,这嵌在平面上的27个点会自动地形成3个团簇,每个团簇代表着一种表情,如图4所示。
图4. 27张人脸曲面的等距嵌入。
问题的关键是如何定义曲面间的特殊几何距离,满足特定的要求。在这个例子中,两张带表情人脸曲面之间的几何差异有两种:一种是由表情的差别所引起,一种是由其长相差别所引起。我们设计的几何距离应该对于第一种差别敏感,但是对于第二种差别不敏感。
图5. 黎曼映照:人脸曲面到平面圆盘的保角映射。
一种普适的几何距离设计如下:首先,我们将每张三维人脸用黎曼映照保角地映到平面单位圆盘上,如图5所示。黎曼映照并不唯一,因此我们需要附加一些规范化条件,例如鼻尖映到圆心,左右内眼角连线保持水平。
黎曼映照是保角的,但是会带来面元的畸变,面元的畸变率表示成所谓的共形因子函数,
同时,黎曼映照将曲面的面元推到平面圆盘上,我们得到一个测度(或概率密度)
。
这样,我们将27张三维人脸曲面转化为平面圆盘上27个概率密度。
平面圆盘上任意两个概率密度之间,我们能够定义所谓的Wasserstein距离(Wasserstein Distance)。假定是一个抽象的黎曼流形,配有黎曼度量,那么流形上所有的概率密度函数构成了所谓Wasserstein空间,
可以证明Wasserstein距离是Wasserstein空间的黎曼度量。Wasserstein距离来自于最优传输理论。
最优传输 最优传输问题最早是由法国数学家蒙日(Monge)于1780年代提出;其解的存在性被俄国数学家Kantorovich证明,由此Kantorovich获得1975年诺贝尔经济奖;法国数学家Brenier建立了最优传输问题和凸函数之间的内在联系。
我们先介绍最优传输问题的数学提法:给定欧式空间中的区域,分别配有概率密度,总测度相同,
。
考察一个微分同胚,我们说这一映射是保测度的,如果对于任意一个博莱尔集合,其原像为,它们测度相同,
。
保测度的微分形式如下:假设的局部坐标分别是,那么成立方程:
,
这里雅克比矩阵为
。
如果映射是保测度的,我们将其记为。
映射的传输代价定义为
。
最优传输映射就是所有保测度的映射中,使得传输代价最小者:
。
我们给出一个粗浅的例子来解释最优传输问题。假设U是整个美国领土,概率密度是美国每英亩土豆年产量,是美国每英亩土豆年消耗率。美国政府需要制定一个土豆运输方案,将土豆由乡村产地运输到城市消耗地,记为。传输方案需要满足供需平衡条件,对于任意一座城市,其土豆年消耗总量等于其供应地土豆年生产总量,换言之,映射f是保测度的;同时,土豆运输方案使得运输成本最小。因此,政府所寻求的最优传输方案就是最优传输映射。由此可见为什么康塔洛维奇(Kantorovich)获得诺贝尔经济学奖。
Brenier定理 法国数学家Brenier证明,如果定义域U是欧式空间中的凸区域,那么存在一个依赖于的凸函数,所谓的Brenier势,其梯度映射
给出了所求的最优传输映射。并且,这种Brenier势在相差一个常数的意义下是唯一的。
我们来看Brenier梯度映射应该满足的必要条件,应该满足保测度条件,
进一步展开,我们得到著名的蒙日-安培方程(Monge-Ampere Equation)
。
因此,最后求解最优传输映射问题归结为求解蒙日-安培方程问题。陈省身先生曾经说过,蒙日-安培方程是所有偏微分方程中最为非线性的方程,其理论分析难度和数值计算难度都是非同小可的。
幸运的是,蒙日-安培方程具有强烈的几何背景,从而可以用凸几何的方法加以解决。我们将在下一讲详尽给出这一方程的几何解释。
【本文博客版本】http://blog.sciencenet.cn/blog-2472277-950946.html
请长按下方二维码,选择 “识别图中二维码”,即可关注。
【老顾谈几何】邀请国内国际著名纯粹数学家,应用数学家,理论物理学家和计算机科学家,讲授现代拓扑和几何的理论,算法和应用。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 04:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社