气象.水.熵.复杂性分享 http://blog.sciencenet.cn/u/zhangxw 张学文的文章,涉及气象、水分、熵、统计、复杂性、一般科学等

博文

8.2第8章2节从百分比们到统计分布—气象统计学私探(49)

已有 1720 次阅读 2020-12-12 11:31 |个人分类:统计气象学19|系统分类:科研笔记

8.282节从百分比们到统计分布气象统计学私探(49

张学文,2020 12 12

 

1.       百分比们:现在小学都知道百分比。例如10岁以下的人口占了全国人口的百分之几等等。但是我们更需要知道不同年龄的人在总人口中占有的不同的百分比们统计分布。在气象上我们问全球空气中不同温度的空气占有的百分比分别是多少。而此问题的答案不是一个数,而是一串与气温对应的百分比数据的集合。这就是对应的各个百分比们。不同气温占有的各个百分比们

2.       由于百分比的值对应于抽样试验中该气温被选中的概率,所以。由百分比们形成的系列实际是对应于概率论中的概率分布函数。这样概率论中的一般的关于概率分布的道理就可以通过百分比们的对应系列而联系到一起了。

3.       对于一个明确的统计分布,显然百分比们的合计值=1。这与概率密度分布函数对自变量的积分=1,是一个含义。现在问,百分比们的平均值是多少?

4.       冷静的一分析就知道(这里从略了),对于任何一个明确的统计分布对象,其百分比们的代数平均值居然是百分比们的平方和!对此的细致说明见张学文,《组成论》一书,以及张学文、周少祥的《空中水文学初探一书的附录1》。这里不多说明了。

5.       由于百分比对应于在一次抽样中被抽中的概率,所以百分比们的平均值,就具有在抽样试验中此分布函数被抽中(或者说得以出现,容易遇到)的概率(机会)的意义。

6.       以上我们谈及的百分比平均值基本讨论其代数平均值。我们也可以分析百分比们的几何平均值。但是,进一步的分析让我们知道,百分比们的几何平均值如果取对数,再乘以-1(为了应对小于1的概率,百分比取对数出现负值的一种办法),则是信息熵--于是我们看到百分比们的几何平均值居然联系上了神秘的熵(信息熵)。而在组成论中此值具有复杂程度的含义。即平均值大,此系统的状态(丰富)复杂程度也大。

7.       这使我们觉悟到:既然百分比们的几何平均值具有概率的平均值值(再取对数,但是不改变物理含义)的意义,而它又是,所以就具有概率平均值取对数的意义。这提示我们所谓熵最大实际上它就是一组概率们的平均值最大。--熵最大的本质对应着此系统状态的出现概率最大

8.       在信息论中分析这些问题的时候,人们发现利用信息熵最大固然可以分析对应的概率分布函数,但是,概率分布函数具体是什么,不完全由信息熵最大决定。而是它配合不同的约束条件,我们可以求得不同分布函数。这可以理解为很多著名的常用的概率分布函数是统一的最大熵最大熵配合不同的约束条件的具体(不同)结果--熵最大几乎使得概率分布的分散知识形成了一个体系,使之提高了一个阶梯。

9.       不同约束条件下的熵最大所对应的概率分布函数,我们在后面列出。而第5,6,7章的那些气象变量的分布函数大多与概率论中的分布函数具有相同的数学结构。这表明气象统计学中的分布函数可以用概率的平均值最大,或者说熵最大配合不同的约束而获得统计理论说明(如果它要求的约束条件在气象学看来是可以接受的,是确实符合实际的)。这样我们关于气象统计领域的分布函数的理论认识就提高了一大步。

10.  本节没有具体引用有关的分析思路细节,有关的公式,但是给出了理解气象统计的分布函数的一种理论思路。有关的仔细说明,欢迎参考《组成论一书》(2003年中国科学技术大学出版社),物理与工程杂志2002年,4,5,6期上关于组成论介绍的三篇文章:组成论介绍(上,中,下),以及空中水文学初探(2010年,气象出版社),一书的附录1.

下面用一个框图概括认识它的逻辑链(遗憾框图没有很好体现出来,箭头丢了...)


 


与统计分布函数对应的是一组百分比的值(如不同气温占有的各个百分比)

这些百分比们的合计值=1,而且这与概率分布的积分=1是等价的

百分比们的平方和具有百分比的平均值的意义,各个概率值们的平方和具有平均概率的意义

而各个百分比的几何平均值,如果乘以-1,取对数,则就是信息熵。信息熵测度了此系统的状态复杂程度

概率平均值大(最大)就是出现概率大(最大),也就是信息熵大(最大),系统的复杂程度大(最大)

概率大(最大)的事情在一次实践中最容易出现,而这也正是熵最大的原理(最复杂原理)正确的原因。

任何一个系统总存在着某些特定的约束条件。而系统如果存在随机性,其出现的统计分布一方面体现着熵最大,复杂程度最大,或者说概率最大,一方面满足对应的约束条件。结果就出现了各种统计分布函数。即大家经常用到看到那些概率分布函数是不同约束与最大熵的共同体现。

概率大(最大)的事情在一次实践中最容易出现,而这也正是熵最大的原理(最复杂原理)正确的原因。

任何一个系统总存在着某些特定的约束条件。而系统如果存在随机性,其出现的统计分布一方面体现着熵最大,复杂程度最大,或者说概率最大,一方面满足对应的约束条件。结果就出现了各种统计分布函数。即大家经常用到看到那些概率分布函数是不同约束与最大熵的共同体现。

 




https://blog.sciencenet.cn/blog-2024-1262171.html

上一篇:8.1第8章1节气象统计原理引言—气象统计学私探(48)
下一篇:8.3第8章3节最大熵获得的一些统计分布函数—气象统计学私探(50)
收藏 IP: 110.152.211.*| 热度|

3 周少祥 檀成龙 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-18 10:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部