|
美国科学院院士、中国海外院士,著名物理学家张首晟先生。
张首晟先生在中国旅美科技协会第二十五届年会演讲《科学、创新和投资》。
2017年十月初,中国旅美科技协会第二十五届年会在纽约哥伦比亚大学召开。在大会中,老顾有幸再次见到了张益唐夫妇和张首晟先生。张益唐先生曾经用杜甫的两句诗来形容自己:庾信平生最萧瑟,暮年诗赋动江关。以前见到张先生,总是觉得他面色冷峻,目光犀利。这次见到他,却发现他面色柔和,目光也内敛了许多。间或一瞥,眼睛突然精光暴涨,摄人心魄。张太太依然热情洋溢,雍容华贵。
大会组织者,旅美科协副会长颜为民告诉老顾,他在机场迎接张首晟教授和招待张教授午餐的时候说起老顾,张教授对老顾写过的一些文章很感兴趣。张教授本来请颜先生安排和谢晓亮教授、张益唐先生共进午餐,经由颜先生的引荐,张教授特别邀请老顾加入午餐。(请参阅“哈德逊河畔的午餐”)。
近几年来,老顾经常暑期在清华大学讲授计算共形几何,课余时常在清华园中随心所欲地游荡,寻找数学上的灵感,也回味青春的记忆。在清华的教室走廊上,张贴着清华系的院士头像和生平简介。其中有一位海外院士,温文尔雅,俊逸潇洒,老顾一眼望去,“玉面书生”几个大字突现脑海。那位就是距离诺贝尔物理奖一步之遥的张首晟先生。这次有幸见到心中偶像,令老顾十分激动。
张首晟先生在大会上做了精彩的报告《科学、创新和投资》,响应万众创新的时代召唤,将优雅超凡的科学品味和睿智深远的投资眼光相结合,为喧嚣浮躁的科技投资界带来了一股清流。张首晟先生的第一性原理,以简驱繁,回溯本真,令人醍醐灌顶,茅塞顿开。
张首晟先生约老顾于其下榻的川普国际酒店面谈。同行的有中国旅美科技协会弗罗里达分会骨干尧圆明教授,老顾以前在法国里昂访学时指导过的弟子、现在西安交大数学与统计学院的李慧斌教授。张先生知识渊博,涉猎广泛,对于物理之外的数学、金融、信息科学等众多领域具有独道而深刻地见解。大家一同热烈地讨论起来。
第一性原理
张首晟先生凭借其深厚的科学素养,敏锐的技术洞察力,和非凡的市场预见力,非常成功地投资了VMWare,最高市值达到480亿美元。最近张先生开创了丹华资本,背后有文艺复兴公司的创始人赛蒙斯先生的加持。赛蒙斯先生是陈省身先生的高足, 纤维丛的陈-赛蒙斯示性类目前已经成为理论物理的基石之一。他创立的文艺复兴公司数十年都是华尔街最为赚钱的金融公司,他本人富可敌国,一个人支持着全美国一半的理论物理博士后的事业。在清华园,林徽因故居附近有一幢风格优雅的别墅,陈-赛蒙斯楼,就是由赛蒙斯捐赠。杨振宁、翁帆夫妇就隐居于此,谱写着一段现代传奇。
张首晟先生高雅的投资品味和他坚定的科学价值观一脉相承,那就是第一性原理。张先生认为科学的最高志向就是简单和普世。张先生说“我们生存的世界复杂而多变,但若是能够对万物寻根溯源,我们就可以用简单对抗复杂,赢得效率的提高。当理解并使用第一性原理时,我们就能够创新地进行新联通,成为中央路由器。丹华资本也期待创业家从第一性原理出发,思考问题。”
离散几何
老顾向张先生解释了近期证明的一些数学定理,主要愿景是在离散的范畴重建经典连续几何。这样做的目的一方面是为了适应计算机科学的发展,另一方面从更为直接基本的角度来重新发现这些定理。经典几何需要流形的光滑结构,这样微积分的工具才得以实施;计算机中的几何表示多为离散数据结构。基本的几何原理应该和光滑性无关,是自然中更为本质的规律。
例如经典的高斯-博纳定理揭示了曲面整体曲率是拓扑不变量,证明需要二阶光滑性和相对现代的几何工具,例如活动标架法。离散曲面的高斯-博纳定理的证明只用到初等组合技巧。李慧斌的博士论文是关于几何逼近理论,建立了离散曲率和光滑曲率之间的关系,所用的理论工具是normal cycle theory。这个理论将曲面嵌入欧氏空间和球面的直积空间,在这个背景空间中找到特殊的微分形式,其在曲面上的积分给出了各种曲率测度。如此,我们将内蕴的高斯曲率外在化,将曲率测度的差异由曲面的嵌入差异来控制。对于给定光滑曲面,我们可以在曲面上面运用共形几何原理均匀采样,然后建立测地三角剖分,再将每个测地三角形用欧氏三角形代替,如此得到光滑曲面的离散逼近。依随采样密度的增加,三角剖分的加细,离散曲率测度收敛到光滑曲率测度。如此我们用离散组合方法证明了经典的高斯博纳定理。我们用这种思想系统地证明了曲面微分几何最为基本一些定理。
双曲几何
欧氏几何
球面几何
单值化定理
依据张首晟先生的第一性原理,曲面几何中最为简单而普世的定理非单值化定理莫属。纷繁杂乱的各种曲面,最终会共形地归结为三种标准几何中的一种,球面几何、欧氏几何和双曲几何。这种化繁为简、万宗归一的理论极大地简化了纯粹理论的探索和实用几何算法的设计。埃舍尔的天使与恶魔系列惟妙惟肖地描绘了单值化定理。张首晟先生将最近发现的粒子取名为“天使粒子”,正是因为看了汤姆 汉克斯的《天使与恶魔》。
这种追求简单而普适的思想在几何中是一以贯之的基本准则。曲面单值化定理在三维流形上的推广是瑟斯顿的几何化定理。三维流形可以用拓扑和操作分解成素的三流形,每个素的三流形都容许八种几何中的一种。其中紧的封闭三流形,如果所有的圈都能缩成一个点,那么它和三维球面拓扑同胚,这就是著名的庞加莱猜想。
黎奇流
为了证明庞加莱猜想,哈密尔顿提出了黎奇流的概念。黎奇流将流形的度量依随时间演化,度量的变换速率和当前的黎奇曲率成正比,使得曲率的变化满足某种非线性扩散-反应方程,当系统达到平衡态的时候,曲率处处为常数。但是,在某些几何拓扑条件下,反应项占据优势,曲率在有限时间内会发生爆破。我们在爆破点将流形一分二,对每一部分施加黎奇流进一步形变。我们需要证明,曲率爆破的次数是有限的。
和连续曲面黎奇流的理论相平行的离散曲面黎奇流的理论已经完全被建立起来,并且转换成强有力的算法,在许多工程和医疗领域发挥着重要作用。张先生告诉老顾有物理学家做过类似的工作,并且给出了具体的名字。同时,张先生也非常关注离散黎奇流在三维流形方面的进展。我向他解释了我们在双曲三流形方面完成的一些工作。几何定理的自动证明一直是数学家梦寐以求的事情。
吴文俊先生的机器定理证明 张先生谈起了人工智能的发展,联结主义的神经网络突飞猛进;符号主义的机器定理证明也在稳步前进。吴文俊先生的机器定理证明足可以证明几乎所有的欧几里得几何命题,很多时候给出了奇特新颖的证明方法。但是,计算机无法将冗长的证明分解成有几何意义的引理,人类对于计算机给出证明的理解非常困难。同时迄今为止,计算机也没有发现非常深刻的、人类尚未知道的基本定理。
对于黎曼面的研究有多种手法,一种方法是用几何分析的方法,建立几何偏微分方程来解;另一种是将黎曼面用代数曲线来表示,用代数几何的方法来研究。代数的方法绝对精确,最后也归结为理想成员判断问题,因此计算复杂度非常高。几何偏微分方程的方法可以适度近似,因此更为迅速高效,在实践中应用更加广泛。但是,有很多几何问题只有代数方法才能给出答案,例如连接分析和拓扑的黎曼-罗赫定理。
费马最后定理
这次旅美科技协会年会的一个热点就是区块链。区块链的核心是将第三方担保由人或者组织替换成技术,特别是分布存储技术和数据加密技术。而数据加密的核心就是数论。随着费马定理的攻克,椭圆曲线加密技术蓬勃发展。黎曼猜测和量子计算的进展必会极大地推动金融技术的发展。
伽罗华群论
谈到了群论,张首晟先生非常欣赏伽罗华的理论。伽罗华为了解决高次多项式方程根式解的存在性问题,只手擎天地发明了群论。伽罗华认为,如果我们能够将一个n次多项式方程进行多步变换,每一步变成某个变量的幂等于常数的形式,那么n个元素的排列构成的对称群可以分解成一系列的嵌套子群,使得每两个相邻子群的商群是循环群,即n阶对称群是可解群。因为五以及更高阶的对称群不是可解群,所以五次方程及更高次方程无一般的公式解。
伽罗华群论是每一位少年成长过程中智力升华的关键环节,伽罗华群论所蕴含的美学价值和精神力量,对于青年价值观和人格的塑造力量不亚于唐诗宋词。在法国,每个男孩成人时收到来自母亲的礼物往往是历史上某位著名法兰西数学家的手稿复印件,一如中国的父亲送给孩子的唐诗宋词选集。
Bieberbach猜想
图2. 保角映射的像集是复平面上的有界单连通区域。
这一保角映射可以用单叶解析函数表示,假设这一映射保持零点不动,同时在零点的导数为1,因此具有级数表示:
,
Bieberbach猜测每一项系数的模。
保角映射的像集是复平面上的单连通区域,有可能是有界区域,如图2所示;
图3. 保角映射的像集是复平面上的有界单连通区域。
保角映射的像集是复平面上的单连通区域,有可能是无界区域,如图3所示。但是,Koebe1/4定理断言,无论如何保角映射的像集的像集包含一个半径为1/4的圆盘 。
图4. Koebe映射。
在极端情形,保角映射的像集覆盖整个复平面,的补集是一个零测度的集合,例如是一条曲线。这条曲线尽量延长,直至接触Koebe1/4圆,如图4所示,这时映射幂级数的系数模也达到了最大:
.
这就是复分析的几何理论中一个非常普遍的神秘现象:几何极值蕴含解析表示的极值。这种几何极值-解析极值的一致性可以用来证明许多保角变换的存在性,例如黎曼映照定理、狭缝映射定理等等。
这再一次验证了张首晟先生的简单而普适的原则。
生成对抗网络 GAN
近年来人工智能的联结主义蓬勃发展,张首晟先生对此做了扼要的总结“人工智能的爆发源于三个重要趋势的神奇汇聚:摩尔定律所描述的计算能力的指数增长;互联网和物联网的爆发性增长所产生的海量数据;智能算法的快速发展。” 张首晟先生比较欣赏对抗生成网络(GAN)的原则:生成器力图产生欺骗判别器的样本,判别器竭力识别真实数据和生成样本,两个神经网络同时训练,彼此通过博弈而共同提高,直至达到纳什均衡,判别器无法区分真实数据和生成数据,整个系统达到最优状态。
图5. GAN模型生成的人脸图片结果。
图6. WGAN的框架。
这一阶段,丘成桐先生带领老顾和几位合作者从理论层面对人工智能的计算模型进行探索。对抗生成网络(GAN)可以用最优传输理论来解释。在统计视觉的观点下,我们将所有的nxn图像构成的线性空间定义为图像空间(背景空间),每张图像是这个空间中的一个点。我们考虑一个概念,例如人脸,那么每张图片有一个概率来描述这张图片是否是一张人脸,如此我们定义了一个概率分布。那么绝大多数图片并不是人脸,因此的支撑集合是图像空间中的一个低维子流形。
深度神经网络最为成功之处在于可以将概念子流形映射到低维特征空间上,特征空间也被称为是隐空间(latent space),特征空间的维数远远低于初始图像空间,这一过程被称为是特征提取,或者编码(encoding)。当然,深度神经网络也可以进行解码(decoding),解码映射从特征空间映回图像空间。
在特征空间中,我们取一个标准概率分布,例如均匀分布或者高斯分布。生成器构造一个解码映射,将特征空间中的分布“推前”到图像空间中的分布,记为生成分布;判别器深度网络计算数据分布和生成分布之间的距离,根据最优传输理论,两个分布之间的差异可以用所谓的Wasserstein距离来衡量:
这里是的所谓c-变换, 传输代价函数是将单位质量从点传输到点的代价,例如。
分布由生成,代入后最终的优化问题可以归结为极小极大问题:
判别器极大化能量,生成器极小化能量,分别由两个深度网络承担;两个网络交替训练,直至达到平衡。在这个模型中彼此独立,分别优化。
但是,丘先生的团队经过深入的研究,发现如下结论:
1.如果传输代价,大于1,那么在判别器最优的和生成器最优的彼此之间存在简单的数学关系,从其中一个可以直接写下另外一个。换言之,我们只需要训练判别器和生成器其中的一个,它们之间的交替训练没有必要,它们之间的竞争实际上是虚构的。
2.计算最优传输和解凸几何中的Minkowski问题和Alexandrov问题等价,都是由蒙日-安培方程来描述。蒙日-安培方程在物理光学方面,具有鲜明的物理意义。
3.最优传输和几何中的Voronoi图/Delaunay三角剖分具有深刻的内在联系。计算几何中power diagram可以给出最优传输的几何解释:判别器的等价于power 距离,生成器的等价于power diagram的胞腔分解,蒙日-安培方程的解等价于power diagram对应的上包络,等等。
这些发现有助于对GAN模型更为深刻本质的理解,和设计更为严格高效的计算模型。
张首晟先生非常赞同用严格理论来解释剖析深度学习模型的方向,鼓励老顾将这些研究成果尽快公布于众。这和他的第一性原理深深契合。
时光飞速流逝,转眼夜幕降临。我们和张先生商定了下次的会晤,在Columbus Circle依依挥别。苍茫暮色中,曼哈顿华灯初上,车水马龙,喧嚣鼎沸,摩天大厦,直耸云霄,上空乌云翻滚,闪电隐然。老顾目送张首晟先生隐没在曼哈顿的万丈红尘之中,宛若一白衣侠士,身怀绝世武功,飘逸灵动,幻影无踪。一曲量子拓扑,天下传唱;一柄资本利剑,杀气千重,投资江湖上必会掀起一片血雨腥风 。。。
原文发布在【老顾谈几何】公众号 (2017年10月16日)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 21:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社