|||
从最大熵原理统一认识主要的概率分布
张学文,
1. 概率分布函数在统计学与概率论里占有主要地位。而被科学界重视、在统计学中经常用的概率分布函数大约就是10多种。早期出名的概率分布是正态、现在比较时髦的幂律分布,另外,负指数分布等也实例很多。
2. 目前教科书对于为什么经常出现这些分布的缘由并没有统一的说明。而很多实际工作者只要用自己的数据在科学界第一次证实它们符合某分布,一般就认为这是个不错的论文。更深的原因一般不涉及。
3. 80年代我们发现负指数分布符合降水量的占有面积分布。1992年出版的《熵气象学》http://zxw.idm.cn/content1.htm#熵气象学 的附录则公布了我们收集大约10个分布函数。其特点是它们都是最大熵原理配合十分简单(合理)的假设的逻辑、数学推理的结果。即我们可以从最大熵原理的角度统一认识这些分布函数的形成原因(或者说存在背景)。
4. 在《组成论》一书里(http://zxw.idm.cn/ZCL/index.htm 2003,中国科学技术大学出版社),我们扩展、充实了以上的认识。并且把这个与热力学第二定律有联系,又不能说这是“热力学的原理”的原理称为最复杂原理,而热力学第二定律是它的特例。这样就理顺了一个认识链。
5. 下面以《组成论》书里18章最后一段作为本博客文章结尾。欢迎关注这个认识。
第十七和十八章介绍了十多种概率分布是如何从最复杂原理推导出来的。它们有的来自文献也有我们自己推导的。这个总体认识形成于80年代末,在90年代初期我们做了努力。当时马力同志负责了不少数学公式的推导工作,并且汇集到《熵气象学》一书中。这里汇集的认识又有进步和深化。另外
收集更多的概率分布、全部用最复杂原理推导出来(也许不可能或者思路很笨)、给出每个分布的全部推导公式、给出其物理含义的一般说明、给出对应的应用事例、给出对应的数值模拟实验的步骤与说明、给出在电脑上的应用程序,这应当是一件非常有意义的工作。它应当由数学工作者、统计学工作者、电脑工作者联合完成,并且形成对应的报告、论文、专著、软件和光盘。笔者的本书是在这个方向做了努力,但是它与这个目标有距离。欢迎有兴趣的人士继续这个工作。
笔者也期待早日把这个认识统一写入统计学教科书,把对应软件汇入流行的统计软件功能中。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 19:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社