||
8.4第8章4节斩乱麻分布的例子—气象统计学私探(51)
张学文,2020 12 19
1. 前面我们笼统的谈到与统计分布函数联系着的各个百分比的平均值这个含义的统计量,它具有此分布函数的平均概率的意义。它也具有状态的分布的复杂程度的物理意义,并且平均概率最大对应熵最大(最复杂)。在这个一般要求下如果再配合对应问题特有中的独立存在的约束条件,可以反求理论的,也是出现概率最高,熵最大,最复杂的概率分布函数。但是上一节仅给出了约束条件,熵最大所对应的一些分布函数。而没有具体处理过程。本节则给出一个实验性的例子,它就是所谓的斩乱麻问题。这里例子简单、明确。
2. 所谓斩乱麻问题,就是给你一段长绳子。让你随机地对它切割任意多刀,于是你获得了一堆乱麻。现在问不同长度的线头占有的百分比各有多少。
3. 对此,你可以直接做对应的实际实验而求得结果,也可以在电脑上做数值实验,还可以做理论分析而获得一个理论函数。
4. 例如,打开一个空白的excel的工作簿,然后取0-10000之间的9999个随机数,就可以把长度为10000的线切成为1万段。这些碎的线段就是随机的乱麻,而且符合总长度为给定值的要求。我们进一步统计(也让excel 的指令做)不同长度的线段占的数量,这已经是答案了。表8.3就是一个类似的实验结果。这个结果对应于线头长度的合计值(总长度)为10000,于是各个线头长度的平均值等于1。
表8.3 斩乱麻实验的一个实验结局
线头长度 x | 线头的数量 y | 线头数量对数值 |
0-0.5 | 3954 | 8.282483 |
0.5-1 | 2369 | 7.770223 |
1-1.5 | 1418 | 7.257003 |
1.5-2 | 877 | 6.776507 |
2-2.5 | 559 | 6.326149 |
2.5-3 | 321 | 5.771441 |
3-3.5 | 213 | 5.361292 |
3.5-4 | 123 | 4.812184 |
4-4.5 | 67 | 4.204693 |
4.5-5 | 34 | 3.526361 |
5-5.5 | 21 | 3.044522 |
5.5-6 | 16 | 2.772589 |
6-6.5 | 11 | 2.397895 |
6.5-7 | 4 | 1.386294 |
7-7.5 | 7 | 1.94591 |
7.5-8 | 2 | 0.693147 |
8-8.5 | 1 | 0 |
8.5-9 | 1 | 0 |
9-9.5 | 2 | 0.693147 |
合计 | 10000 | - |
5. 以线头长度与出现次数做直角坐标图,就看到随着线头长度增加,出现次数迅速减少。如果做线头长度与出现次数的对数的关系图,则获得下面的图。
6. 这个图已经说明线头长度与其数量是负指数函数的关系。
7. 记住我们切割的线仅是一根线,这保证了无论如何切割它,其线头长度的合计值为常数(即平均值为常数)。而我们在很多气象问题中,这等价于平均值是常数。所以气象统计中出现负指数分布,应当是某平均值不变下的随机分割的结果(你再找不到其他的统计理由解释它)。
8. 对斩乱麻问题的细致说明,见张学文,马力,在数理统计与概率应用杂志上的对应文章1997年12月4期315*321页。也可以参考http://blog.sciencenet.cn/blog-2024-718046.html 数学家对此从最大熵也可以配合平均值=常数,而理论性的获得此概率分布。这里就不具体说了。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 23:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社