|||
作为一个年长资深的研究人员,常遇到有青年学者或学生,不知是出于敬老礼貌还是真心讨教,会问我这样一类问题:应该怎样选题?怎样做研究?每到此时,总有点尴尬,不禁想起李白的打油诗:“眼前有景道不得,崔颢题诗在上头”。关于做学问、做研究,许多名家大师,都有过许多精辟见解。像我这样,充其量也只能算个“猫辈”——如果比“鼠辈”略强的话——怎敢充当青年导师?就拿同行前辈何毓琦先生来说吧,他的博文内涵丰富、文笔流畅不说,那直爽敢言的评述,淋漓尽致的人生经历,句句都让人折服。那本博文集是我的案头之牍,时时翻阅。也让学生人手一本,学做学问,学做人,也学英语。
自己既是猫辈,当然无法与大狮(师)相比。但当了大半辈子的猫,自以为也学了一点三脚猫的功夫,所以也会技痒,故不揣简陋,也来现丑。本想说一番做研究的大原则或大道理,但实在腹中空空,编不出个子丑寅卯来。于是就想谈谈自己近十几年醉心的一项工作:矩阵的半张量积。介绍一下它研发的过程,以及它的内容和应用,无非是老王卖瓜。但倘若对年青学子有点滴启发,也算老猫对后生们提的问题的一个交待吧。
大约在1998年前后,在做非线性系统的控制设计时,遇到大量多元函数与多元映射的计算问题,如流形上各种李导数、分布的对合性以及流形上的张量场计算等。当时有一些符号计算的软件,可直接做非线性函数的运算,但计算量大、结果极其复杂,难以应用。通过台劳展开,用多项式近似非线性映射成为一个顺理成章的想法。一个齐次多项式很容易看成一个多线性映射,而张量更是典型的多线性映射。于是,矛盾被聚焦到多线性映射的计算问题。
众所周知,矩阵是数值计算的最有力工具。矩阵方法可以方便地应用于线性映射和双线性映射。但它对三维或更高维数组却几乎无能为力。能否用矩阵方法处理三线性甚至多线性问题呢?这时,调研成了一个不可逾越的必要步骤。一番搜索,果然有所收获。原来早在八十年代初,就有人提出了立体积的概念[1,2]。它的想法很自然,就是把三维数组摆成立方体。随后,我国学者对矩阵立体积做了许多工作,如[3,4]在其基础上进行了系统的总结和扩充。[5]中有一个简明的综合介绍。立体阵在统计中得到一些成功的应用。但由于它需要引入许多新的运算规则,使用起来不甚方便。对于四维或更高维的数组运算,立体积也无能为力了。对此,我国学者张应山提出了多边矩阵理论[6],这是一个创新性的工作,但由于其计算过于复杂,没有得到广泛推广。
看来,已有的工作不能满足我们的需要。但有些想法还是很有启发的。特别是[6]力图通过多边矩阵的方法对变量与其相应的系数进行配对,这种想法是矩阵半张量积的出发点。不管是立体积或多边矩阵,它采用的都是矩阵普通乘法的“一对一”的办法。这样,高维数组就不得不排成立体或更高维的矩形体的形式。要想把高维数组排成一个向量或一个矩阵,就必须改变“一对一”的乘法规则,允许“一对多”。同时,这种新的乘法还要能够自动地将系数与其相应的变量进行配对。这就是我们后来找到的矩阵的半张量积[7]。
设A为m×n矩阵,B为p×q矩阵。当n=p时,称A与B满足等维数条件,此时,半张量积退化为普通矩阵乘积。当n是p的倍数或p是n的倍数时,称A与B满足倍维数条件。多线性映射碰到的都是这种情况。因此,矩阵半张量积最初也是对倍维数情况定义的。那么,能否将矩阵半张量积推广到任意两个矩阵呢?我们根据半张量积的一个性质,将矩阵半张量积推广到任意两个矩阵。
1998年清华大学卢强院士与中科院系统所联合申请国家自然科学交叉重点项目:电力系统非线性鲁棒稳定控制代数化几何方法及工程应用。其理论设想就是发展矩阵半张量积方法,并用以实现非线性控制系统几何理论中常用的李导数、张量场等非线性计算。该项目完成过程中,矩阵半张量积的框架逐步形成。但是,将一个新的矩阵乘法推向世界是一个艰难的过程,几乎没有人相信在矩阵乘法这样—个初等概念上会有意义的突破。在多次向国外杂志投稿失败后,我们转向国内并将基本概念结合应用问题推出。第一篇关于矩阵半张量积的文章是结合非线性系统的Morgan问题数值解而提出的[8]。
此后,结合电力系统稳定域、非线性控制设计以及其他数学物理等问题,矩阵半张量积理论与方法得到应用和发展。这些工作主要发表于一些国际期刊上。在这些工作的基础上,我们出版了专著[7],它成为《现代数学基础丛书》中的一本。关于它的一个简明综述在2007年世界华人数学家大会上作了45分钟报告[9]。从提出矩阵半张量积到2006年,我们的基本工作都集中于半张量积在连续动态系统中的应用。后来,我本人的重点就转移了。清华大学梅生伟教授率领一个团队,一直坚持这方面的研究。他们最近的一本专著[10],是矩阵半张量积在电力系统中应用的一个很好的总结。
矩阵半张量积逐渐有了一定的影响,但同时,也在同行中引起了一些不同观点的争论。争论之一:矩阵半张量积的原创性。它是否是新的。它在定义上是那么简单明了;在性质上是那样完美——与普通积无异;在计算上是那么便捷易行;而它的应用又是那样广泛普适。那么,为什么那么多前辈高手都没有发现它,而直到今日才被我等猫辈发现?
原因之一是半张量积的基本思想来自计算机。例如,在C语言里,多维数组不必排成高维立体的形式,C语言通过指针、指针的指针、指针的指针的指针……来寻找数据的不同层次。其实,半张量积的自动寻配也就是依靠规则去自动寻找相应的指针,或曰数据层次。原因之二,半张量的真正应用离不开计算机。如果靠纸和笔,甚至造一个有意义的例子都很困难。也许,这使得半张量积只能在计算机时代出现。
争论之二:半张量积的科学含量。有些人认为,半张量积太简单了,把矩阵乘法推广到任意两矩阵是一件容易的事。还听几位老先生说,华罗庚先生当初就给了一个推广:考虑A×B。如果A的列数小,就补上若干零元素列;如果B的行数小,就补上几个零元素行,使得最后A的列数与B的行数相等。这当然是一种推广,而且,大概是最简单的推广。我们在最近的一篇文章里首次披露了我们在研究过程中考虑过的几种推广[11],这也说明了给出一种推广并不难,难的是:它要不改变原来矩阵乘法的性质,同时,它要有用。当然,我们也许是运气,找到了这么一个。而且,很可能还会有其他有用的推广。再说简单,老子说过:“大道至简”。记得哈代也说过(没有找到相关参考):“数学上只有简单的结果才有意义。”
有点跑题了,还是书归正传,回到半张量积的研发历史吧。2006年我到瑞典访问,初冬的斯特哥尔摩真是够受的。早晨10点天才开始蒙蒙亮,到了下午3点,街道就全靠路灯照明了。雪,夹杂着雨点,夜以继日地下个不停。铲雪车和撒盐,都赶不上积雪的速度,到处是泥泞。那是一个周日的早晨,我懒懒地起了床,吃了两片面包和一杯牛奶,我呆呆地望着窗外,外面仿佛是一个无人仙境,未被踩踏的白雪覆盖着大道,房屋和树木,只有晨曦中的飞雪,给这个银白的世界些许生气。
百无聊赖之际,忽然想起昨天在旧书店花50克郎买的一本数学手册[12],赶紧找出来把玩。鲁迅先生所言不差:“无聊才读书”。书的第一章是离散数学,第一节是逻辑。我虽未学过逻辑,但当年在美国教过本科生的Contemporary Mathematics(当代数学),接触过一点。为了复习一下自己那半吊子的逻辑知识,我拿出纸笔,试图证它几个简单公式。几个等式算过,头脑里忽然闪过一个念头:这不是可以用半张量积算吗?
我把向量(1, 0)对应“真”,(0, 1)对应“假”,于是,每个逻辑表达式都可以用一个矩阵半张量积来表示了。强压着兴奋的心情,我又用此证了几个逻辑等式,终于相信这是对的了。
我把那本数学手册放在嘴边亲吻了一口,就跑去开冰箱找啤酒了。如果预知以后事情的发展,我想,花5000克郎买那本手册也值。在[11]中有一章,是关于逻辑的半张量表示。这个工作的初衷是一种纯数学的兴趣,是那本手册和斯特科尔摩冰雪的功劳。我当时曾试图将其应用于模糊控制,但不过是写了两篇文章,并不是很成功,其实当时对模糊控制很不了解。
常常听到这样一句话:“机会总是留给有准备的人。”相信我,这句话是真理。我很幸运,遇上了这样的机会。2008年初,新年刚过,我在香港第三次中瑞双边控制会议上听到清华大学赵千川教授关于布尔网络的报告。他说到,就是两阶的布尔网络动态系统要想给出不动点和极限圈的一般公式表示也很困难。布尔网络动态系统是一个逻辑动态过程,对于逻辑过程,人们掌握的工具很少。我的脑子忽然像过了电一样:如果用半张量积把它表示成矩阵形式,那不就可以用代数的方法来解决它了吗?
那天晚上,我把赵教授请到我的住处,我说:我不懂布尔网络,你现在是我老师,我把我听你报告的理解跟你讲,你帮我把关,看讲得对的对。我们讨论到很晚,我真弄懂了。他临走,我对他说:我或许能找到N维网络的一般公式。赵教授年轻有为,他是我学习布尔网络的第一位老师。
从这次会议回来之后,我苦苦思索一个问题:一个逻辑动态方程可以转化为矩阵形式,那N个方程怎么合到一起呢?最后,终于想出了一个方法:把它们乘起来。这样,一个逻辑动态方程就变成了一个差分方程,传统的矩阵分析方法就可以用上去了。这个发现,为布尔网络的研究找到了一个便利的工具。
2008年春节,我从大年三十一直干到春节过完,大门都没出。我一口气写了三篇长文:Analysis and control of Boolean networks:Part 1. Topological structure of Boolean networks; Part 2. Input-state structure of Boolean networks; Part 3. Controllability and observability of Boolean control notworks。这三篇文章投到IEEE TAC,很快就被拒了。但主编Cassandras明显表示,这里可能有非常有价值的东西。他甚至同意我们改成Part 1-Part 2再投。TAC发长文是很难的事,为争取尽早让我们的成果面世,后来将Part 1投IEEE TAC,Part 2投IEEE TNN,Part 3投Automatica。它们先后均以长文(Regular Paper)形式发表了。TAC的最慢,晚了一年。这说明分开投的决策对了。
此后,布尔网络控制的半张量积方法在状态空间描述、各种子空间的定义与计算、布尔控制系统的状态转移阵、优化控制等取得一系列突破,逐渐形成了一套较完整的理论体系。我们在Springer发表了470页的专著[13],可以自豪地说,该书中所有结果都是我们自己的。
其实,半张量积还可以用到许多其他有限值映射问题中,如动态博弈、模糊控制、编码、线路设计、有限自动机等等。我们即将出版的另一本专著对这些问题做了详细介绍[14]。最近,应《科学通报》主编夏建白院士邀请,我们写了一个关于矩阵半张量积的特邀评述[15]。交稿后,夏主编又特别邀请郭雷院士写了一个点评[16]。
最近,我们的相关论文“Controllability and Observability of Boolean Networks”获得国际自动联合会(IFAC)颁发的“Automatica”2008-2010“最佳理论/方法论论文奖”。“Automatica”是IFAC主办的国际控制领域的顶级刊物之一。IFAC从1981年开始,每3年评一次,每次评“最佳理论/方法论论文”、“最佳综述论文”和“最佳应用论文”各一篇。当选论文作者包括:B.D.O. Anderson(澳大利亚前科学院院长,澳两院院士),K.J. Åström(瑞典两院院士),L. Ljung(2次,瑞典两院院士),A.S. Morse(美国工程院院士),A. Isidori(2次,IFAC前主席),H. Kimura(2次,IFAC最高奖Quazza Medal获得者),还有J. C. Willems,M. Vidyasagar,C.I. Byrnes,M. Spong等控制领域著名教授。我们的上述论文是由华人作者完成的第一篇获该奖的文章。
矩阵的半张量积是我国学者的原创性工作,它正在受到国内、外学者越来越多的重视。现在,已经有一批由其他国内外学者完成的以半张量积为工具的后续工作出现在IEEE TAC、Automatica、IEEE TNN等一些最好的国际控制杂志上。研究内容涉及动力系统、网络、线路设计与检测等。矩阵半张量积可望成为计算机时代一个重要的数学工具。
假如你看了这个关于半张量积的故事有所触动,感到它确实说了点什么,那这篇文章就没白写。最后,用自己的一首诗来结束本文。
《My Baby》
(写给我的Semi-tensor Product。)
你是我的心,
因为
我用我的心
饲你。
你是我的魂,
因为
我用我的魂
塑你。
多少个夜半深更,
我辗转未眠
想你。
多少个风和丽日,
我孑然面屏
书你。
我赞美你的容颜
简洁!
我惊叹你的身手
犀利!
我感谢上帝,
让我遇到了你。
愿我离去的一天,
无愧今生:
我的 Baby,
你将在人世间
长存!
参考文献:
[1] Bates D M, Watts D G. Relative curvature measure of nonlinearity. J R Statist Soc B, 1980, 42: 1-25
[2] Bates D M, Watts D G. Parameter transformations for improved approximate confidence regions in nonlinear least squares. Ann Statist, 1981, 9:1152-1167
[3] Tsai C L. Contributions to the Design and Analysis of Nonlinear Models. Doctor Dissertation. Minneapolis: Univ of Minnesota, 1983.
[4] 韦博成. 非线性回归模型LS估计量的二阶矩. 高校应用数学学报, 1986, 1: 279-285.
[5] 王新洲. 非线性模型参数估计——理论与应用. 武汉: 武汉大学出版社, 2002.
[6] 张应山. 多边矩阵理论. 河南: 中国统计出版社, 1993.
[7] 程代展, 齐洪胜. 矩阵的半张量积——理论与应用, 北京: 科学出版社, 2007 (第二版, 2011).
[8] Cheng D. Semi-tensor product of matrices and its application to Morgan's problem. Science in China, Series F, 2001, 44(3): 195-212.
[9] Cheng D. Semi-tensor product of matrices and its applications: A survey. In: Proceedings of ICCM 2007, Hangzhou, 2007: 641-668.
[10] 梅生伟, 刘锋, 薛安成. 电力系统暂态分析中的半张量积方法. 北京: 清华大学出版社, 2010.
[11] 程代展, 齐洪胜. 矩阵半张量积的基本原理和适用领域, 系统科学与数学. (to appear)
[12] L. Rade, B. Westergren. Mathematics Handbook for Science and Engineering, Studentlitteratur, Sweden, 1989.
[13] Cheng D, Qi H, Li Z. Analysis and Control of Boolean Networks: A Semi-tensor Product Approach. London: Springer, 2011.
[14] Cheng D, Qi H, Zhao Y. An Introduction to Semi-tensor Product and Its Applications, World Scientific, 2012. (to appear)
[15] 程代展, 赵寅. 矩阵的半张量积: 一个便捷的新工具, 科学通报, 56(32): 2664-2674, 2011.
[16] 郭雷. 评“矩阵的半张量积: 一个便捷的新工具”, 科学通报, 56(32): 2662-2673, 2011.
[17] Cheng D, Qi H. Controllability and observability of Boolean networks, Automatica, 45: 1659-1667, 2009.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-10 07:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社