||
答丁教授之一 “感谢”
(20070912,张学文)
最近丁裕国教授(南京信息工程大学)在科学时报上他的谈"马太效应"博客文章中,提到了“近年来,张学文先生在他的专著《组成论》一书中从熵极大原理出发,利用广义集合的数学方法,推证出复杂度公式,从而证明在自然界和社会现象中普遍存在的概率分布函数都是在给定的约束条件下的最复杂化事物的一种定量描述。例如,负指数分布和幂律函数分布,就是最典型的两种。张学文先生的这一开创性研究成果,其影响远远超过了他所从事的气象学界,而在其它学科和学者中反响强烈,受到好评,笔者也在同行中多次呼吁,不要总以为自然科学中只有确定论的方法论是有用的,随机论中的概率统计规律,人们至今也未完全理解,其中需要探索的问题多多。例如上面所述的“马太效应”所形成的结果,如今可以概括为负指数分布和幂律函数分布,但作为一种事物变化过程的数学模型,我们至今还不能恰当描述。”
我十分感谢丁教授注意到了我一再提倡的一个认识:在自然界和社会现象中普遍存在的很多分布函数(如正态、幂律、负指数…)都可以用复杂程度最大、最大熵(最复杂原理、熵原理)配合不同的约束而理论性的导出。这样就把统计学里最常用到的一些概率分布用一个更基础的理论联系到一个系统中去了。
我认为统计学教科书在介绍这些分布时,用这个理论来统帅它们,就可以使统计学的理论水平提高一大步。
《组成论》里对各种分布函数的理论说明,已经得到不同背景的人士的一些称道。这对我都是鼓励。下面附上我在2006年奇迹论坛上的一个发言,算是对此的补充:(下面言论发表在2006.1.15)
力不从心的野心--用一个原理统帅主要的概率分布公式
1. 感谢奇迹论坛有这么多读者(浏览量接近1万了)关心幂律的理论问题的讨论(2005.9.4-2006,奇迹论坛),感谢冯博士费心找文献,以便努力把有关情况弄得清楚一些。如果中文在21世纪尚不是科学学者使用的语言,如果中国从来不是科学的车轮经过的地方,那么我好像感到这里离所谓“科学殿堂的中心(裁判所,法庭,权威学术刊物),不是太远了”。
2. 昨天我没有急于发言,不期讨论延及潜科学网站,鲁晨光同志也卷了近来。结果他附带道出了“我一直认为张老师有野心推导出所有常见分布”的话。我承认这是我多年的野心,也是我力不从心的事(幂律只是这个事情的一个环节,一个例子)。
3. 我在这里说这个话是看着这里人多,希望大家协力完成(或者审定)这个野心(说不定冯博士又考证出这个任务已经早就被国外完成了,不过,我都摆出了,也许用中文写,一时还出不了“洋相”)。
4. 1991年第3届熵与交叉科学讨论会(该会我在1986年策划,87年在新疆开第1届,与E.T.Jeynes 开创的最大熵研讨班几乎是同时)是在四川开的,那也是第1次认识鲁先生,而我在哪个会上介绍的就是“用最大熵得到了那些概率分布”,并且提出推导出所有重要概率分布的方向。可能就是这个发言,鲁先生记住了我野心。
5. 这个野心就是,把目前的统计学中常用的概率分布都在最大熵原理的组织下形成一个体系,就好像牛顿把自由落体、手榴弹的抛物线、地球的圆运动,行星的椭圆、彗星的双曲线运动都归入第2定律配以不同的约束条件。
6. 时间过去了10多年,我力不从心。我写《组成论》,最后说“我们提出了用最复杂原理统一认识各种概率分布的思路,也列举了很多例子。但是从最大熵原理对每种概率分布函数进行研究是重要问题。这个工作需要深入和系统化。另外我们提出的根据最复杂原理数值模拟各种概率分布函数的工作也应当针对每种概率分布函数都给出具体步骤。这些都需要有人系统的去做”。
7. 我无力仔细调查国外的情况,但是我看到的国内的统计学教科书和国内出版的国外的统计学教科书,我没有看见一册是按照这个认识去组织的写成的,而我认为这个体系是最好的(当然在我看最好是用我提出的最复杂原理,而把神秘的熵原理放到后面)。目前统计学的科学地位不高的原因就是没有理论,只有技术,方法,判据。而统计学几乎是广义的理科大学(包括医学、社会学)都必须学的知识。
8. 在这个大视野下,幂律只是个重要的例子,《组成论》里给了更多的例子。而全面审定和给出各个概率分布(应当也包括物理学上的玻尔兹曼、麦克斯威、玻色、费米分布)的证明、数值试验,实际例子,有待大家的努力。我是希望有的读者去做这个事。要说写文章,这里不止有100篇文章可以写。20年后,统计学的书这样编,就是大进步。
张学文2006,1,15
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 01:29
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社