||
§4皮尔逊Ⅲ型被广为应用的原因
在实用的概率统计研究中,皮尔逊给出的一簇概率密度分布函数是广为人知的。它们不是从什么理论中推导出来的,仅是从数学上考虑具有概率密度性质,又有相当弹性的一簇函数,其中最出名的可能是他的第三种类型的曲线。简称皮尔逊Ⅲ型(皮Ⅲ型)。有相当多的自然现象符合这种概率分布。在降水和河水流量研究中它被广为引用。
问题是:为什么有很多自然现象的出现概率遵守这个分布?!
我们早巳知道不少现象遵守正态分布,这在统计上已经从理论上阐明原因了。但皮尔逊Ⅲ的分布仍仅是个经验方程。
我们一再引用的统计模型并不仅仅是个数学模型,它是个物理模型,它有清楚的物理考虑。它是在两个约束下根据各种单态出现的机会都相等的这一可接受的假设进而运用数学工具导出了最易出现的分布律;在这里我们要把这些结果作一点延伸,这个延伸使我们从指数分布走向皮尔逊分布。由于指数分布已经有了物理基础,所以皮尔逊Ⅲ型的分布理论原因也就引出来了。
(1)指数律的卷积分析--Γ分布
上一节讨论了在一个固定的单点上(降雨观测站)独立的降水过程形成的雨量x遵守指数型的概率密度分布。即概率密度为
(6.41)
如果进而研究n个独立的降水过程形成了n个降水量,那么其合计降水遵守什么分布呢?
(A)n个独立的指数型分布的变量x的合计值xn的概率密度分布问题
现在先考虑某地的降水过程的平均雨量为,并有两次独立的降水过程发生了。一次的实际降水量为α另一次为β。如问一次为α另一次为β这种事件发生的概率密度是多少,那么如何计算?
由于它们都分别遵守同一的指数型的概率密度分布律,又由于这两次降水是彼此独立的,因而可以应用概率的乘法定律;即两个独立的事件发生的概率(或概率密度)为各自发生概率(或概率密度)的乘积。对指数律采说这表明降水为α和β(在两次降水中)的事件发生的概率密度为
这是个两维的概率密度。
如果不细究α和β取什么值,而仅分析它们的合计值α+β并把它用x2表示,那么新随机变量x2的概率密度f(x2)显然可以
写为如下积分
(6.42)
β的值在积分时显然不能小于零,也不能大于合计值x2,故积分限从零取到x2。附带再说一次x2是两次降水的合计值,不是第二次的降水量值,第二次降水量值是β。
积分上式可得
(6.43)
这是两个遵守同一的指数分布的独立变量的合计值x2的概率密度公式。内中为一个变量的平均值(期望值)。
如果有n个遵守同一的指数分布的互相独立的变量,应用概率乘法定理而分析这n个变量的合计值xn的概率密度f(xn)我们可以得到
(6.44)
在n=2时,上式退化为(6.43)。这表明在n=2时的正确性巳经被证明了。现在让我们用数学归纳法再进而证明在f(xn)正确的条件下对f(xn+1)也正确。那么就完成了全部的证明。为此我们用n个变量的分布f(xn)和另一个与它们独立的变量x的分布也作先前的积分,即可得出n+1个变量的合计值xn+l的分布f(xn+1):
积分得
(6.45)
显然上式与(6·44)式是完全一致的.由于n=2时(6·44)正确,又由于在n= n时(6·44)式成立的假设下可以证明n变为n+l时也正确,所以用数学归纳法就证明了(6·44)式是正确的。
随机变量合计值的概率分布一般都用前述的求积分的办法来解。这种积分在数学上常称为卷积,所以实际上我们是对一个遵守负指数律的变量作了卷积。这个变量由于仅能取大于零的值(发生了降水时,降水量值不可能小于零)。所以这里的卷积是从零开始求积分的。
在数学上人们常把具有(6·44)形式的概率密度分布函数称为遵守Γ分布。
可以说遵守同一的负指数分布的随机变量x(它仅含一个参数i)的n个独立的合计值遵守以x和n为参数(两个参数)的Γ分布。这个分布函数和它随n而变化的情况我们示于图6.7中。从图上可见n=l时即为负指数律,最大的概率密度出现于变量为很小的值的场合下,n值加大概率密度最大值则向量变大的方向移动。
图6.7 n次降水过程的合计降水量的概率分布
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 15:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社