larryxia的个人博客分享 http://blog.sciencenet.cn/u/larryxia

博文

数学家不喜欢交叉项

已有 2792 次阅读 2020-2-14 01:43 |系统分类:科普集锦

数学家不喜欢交叉项

许秋雨,2020年2月9日

 

老天创造这个世界主要靠得是交叉项。亚当和夏娃的交叉就创造了人类,而各种其它物质的交叉项创造了各种动物和植物。它们中有的是帮助人类生存,有的是肉食人类。各种让人类生存的暂不提,就说当下的新圆型病毒,据有些科研人员说它们也是来自交叉项,即来自于SARS和AIDS病毒的交叉。这种交叉出来的东东更毒,当然这都只是据说,还没有确证。

 

有了交叉项,一个两元的世界一下就变得丰富了和拥挤了,有时也变得危险了,凡事都有好有坏,下面就不提坏事了。比如0和1,这两个最简单的数字交叉,就出现了我们现在的各种各样的数字产品。现在这个世界上,有很多很多有雄心壮志之士们,正想靠着这两个数的交叉来取代亚当和夏娃呢,当然这得得到老天的同意才行。

 

尽管交叉项给人们带来很多喜悦和惊奇,但在数学上,数学家们并不喜欢交叉项,甚至于非常讨厌它们。这主要是因为,它们给数学家们带来很多不便和烦恼。比如几个变量之和的n次方,如果把它展开可啰嗦了。但是,如果它们的交叉项都没了,即它们不交叉,那么它们之和的n次方就是它们分别n次方之和:

x1+…+xp= x1n+…+xpn

这有多简单呀。

 

上面这个公式不光展开后简单,它在很多应用中也非常有意义。如,你要优化一个有上面p个变量的目标函数,如果你能确定,这个目标函数中的这p个变量沒有交叉项,即你能把这个目标函数分解为p个子目标函数的和,那么对原来p个变量的目标函数的联合优化,可以拆成p个目标子函数的分别优化,而这p个目标子函数中的每个只有一个变量。这样就把p个变量的联合优化变成p个单个变量的个体优化问题了。这就大大地降低了优化复杂度。这样会在很多情况下,由不可行变得可行。

 

一个简单的例子就是2000年左右热门的无线通信中多天线空时码的编解调的问题。如m个天线发射p个变量,在接收端要把这p个变量解出来。一般情况下,它们的最优解法是联合搜索这p个变量值。当p不小时,复杂度非常高。但是,如果在发端做适当的空时编码,在收端,这p个变量的交叉项可以消掉,即没有交叉项。这时,正如上面解释的,它们的解调等价于这p个变量每个分开单个解调,其解调复杂度就是线性的了。第一个这样的设计是原AT&T的阿拉母梯先生在1998年对两根发射天线做的码,业界叫阿拉母梯码。在任意多发射天线的情况下,这样的码叫正交码,意思就是所有变量在接收端将没有交叉项出现。后来发现,这一般情况下的正交码的设计,与最古老的数学密不可分,是数学中的一个核心问题。它们等价于复数域的推广,叫数体,再推广叫组合二次型。比如,对两根发射天线的阿拉母梯码,它在两个时刻内发两个带有信息的符号。当这两个符号都是实值时,阿拉母梯码等价于一个复数。但是,在无线通信里,发实符号不合算。在当两个符号是复值时,阿拉母梯码就等价于四元素体了。我们组后来有幸地在这个方向上得到了一些新的数学结果。有兴趣的读者可以参考我在特拉华大学的网页

https://www.eecis.udel.edu/~xxia/Math_EE.pdf

 

再一个数学家不喜欢交叉项的例子是80年代出现的自由概率理论(英文叫free probability theory)。我们大家熟知的概率论是对实变量的,了不起推广到复变量。这些变量的乘法可交换,如x1x2x1x2=x12 x22。如果对它们求期望,那么E(x1x2x1x2)=E(x12 x22)>0,它不等于0除非x1或x2是0。这意味着x1和x2的交叉项存在。80年代加州大学伯克利分校有位V先生为了研究一个冯诺依曼猜测,发明了自由概率论。他研究的随机变量不是实或者复变量,而是乘法不可交换的量,如矩阵。这时麻烦来了,对这些变量,怎么定义分布函数呢?大家都知道,对平时概率论中随机变量,有任意阶矩(moments),它们形成一无穷级数。在很多情况下,这个级数和分布函数是等价的,具体的正像复函数的罗朗级数展开,它与复分析有关。V先生正看到这一点,他很机智地用任意阶矩来刻画乘法不可交换的随机变量,叫自由概率论。

 

大家都知道,在普通大学学的概率论里最重要的定理是中心极限定理。它是关于多个随机变量和收敛到何处的定理,说了,只要适当的正规化,它们的和趋于高斯分布。在自由概率论中,V先生也关心多个随机变量和的趋势问题。但是,因为这时只能研究各阶矩,对多个变量,它们的和的高阶矩是高阶多元多项式的期望,展开后就很复杂,很难继续讨论。这时,V先生又机智地说了,如果这多个变量的交叉项在求期望后都消失了,或者大部分都消失了,那这个和不就变得简单了么?所以,V先生定义说,如这些变量有这样的性质的话,它们叫自由变量。简单地说,变量x1和x2是自由变量,类似如果

E(x1x2x1x2)=0 当E(x1)=E(x2)=0,其具体定义可参考我在《科学网》的一简单介绍短文“自由概率理论简介”

http://blog.sciencenet.cn/blog-3395313-1164450.html

或者

https://www.eecis.udel.edu/~xxia/Free_Probab.pdf

 

V先生就是让尽量多的变量间的交叉项消失。有了这个定义后,V先生也得出一个类似于中心极限定理的定理。他说,多个自由随机变量的和在适当的加权后收敛到一个叫半圆分布的变量。这个半圆分布类似于普通概率论里的高斯分布,Wigner最早得出独立同分布高斯分量的随机矩阵的特征值的分布趋于半圆分布,当矩阵的维数趋于无穷大时。它叫Wigner半圆律。V先生的自由随机变量被自然而然地应用到了比较任意的大维随机矩阵,成为近几年的一个研究热点。当矩阵维数越来越大时,假如所有矩阵里的元素相互独立且0均值,这时它们的交叉项也越来越接近0均值,所以交叉项的期望越来越接近0。也就是说,大维随机矩阵接近自由了。 关于自由概率论的一个简单描述可以参看我的特拉华大学网页上的短文。

 

以上只讲了两个数学家不喜欢交叉项的例子,应该还有很多其它的例子。其实在更多时候,数学家也沒办法,那些交叉项就是存在着,不喜欢也不行,人们得想出办法来研究它们。




https://blog.sciencenet.cn/blog-3395313-1218401.html

上一篇:外行说说呼吸道病毒感染的谱分析
下一篇:年味
收藏 IP: 108.36.212.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 00:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部