“气候”在很大程度上具有概率性。从这个意义上说,一切气候事件(包括极端气候事件)的诊断、模拟和预测,其理论基础必然涉及到气候及其变化的基本概率属性。地球上任何地点或地区乃至全球气候所发生的变化,都是指:表征气候的某种变量其围绕着相应的平衡状态的概率分布型态有了某种改变。而在其概率分布的两端尾部大约10%(或5%)概率以内所对应的小概率事件及其分位数正是所谓的“极端天气和气候”的统计特征状况。
为了深刻阐明气候的这些概率统计特性,一般可认为,气候变量是某种随机变量,它们的数据结构也可以用某种最佳的概率分布模式(或模型)加以描述。
1 气候事件的定义
众所周知,在量子力学中,对于微观体系的一次测量结果通常并不足以有把握地预测微观体系的某一特性,这种一次测量又被称为一次试验(或实验),而大量相似的试验(或实验),就有可能说明微观体系的某一特性。换言之,我们并不注意单个体系(即实验),而是考虑由非常大数目的 个体系所组成的集合。这就是统计物理学中所谓的“统计系综(简称系综)”。原则上,每一个系综可想象为任意大。而每一个体系的相似是指满足相同的实验条件而言。假定实验的一个特殊结果(称其为事件)在系综的全部体系中有某个结局,那么,
称之为结果(或事件)的出现概率(又称为几率)。我们可用概率论中的所谓“古典概率”来定义。即在一定的条件下重复若干次相同的实验,某个事件出现的次数与其实验总次数之比称之为某事件的概率。显然,根据此定义, 概率在0与1之间取实数值。通常我们称这样的事件为随机事件。显然,所谓随机事件就是事先并不知道其是否出现(或发生),因此它具有不确定性。从这个意义上说,“概率”本质上就是对随机事件不确定性的一种度量。在极端情况下,若某事件在一定的条件下必然不会出现,即称它为“不可能事件”,其概率为0,相反,若某事件在一定的条件下必然会出现,即称它为“必然事件”,其概率为1。显然,一般情况下,某个事件的出现概率为 。在相同的条件下,对于任何气象、气候变量的一次观测,都可近似地看作为一次试验或实验,如同上面的定义,对于相同的条件下所得的观测记录,统计其出现某一事件(符合某一特殊结果)的比值。常称为该事件出现的相对频数,又称为频率,概率论早已证明,在试验次数相当大的条件下,频率将以概率1收敛到它的概率,在一般情况下,频率只是概率的一种实验值(又称样本值)。后面将要看到,通常用频率来代表概率,应考虑其与真实概率的偏差大小,且样本愈大,频率对于概率的代表性愈好。
2 分位数
如前所述,概率分布描述了某一气候随机变量 的全部概率特征。所谓“ 分位数”就是某一随机变量 小于数值 的概率,这一对应的数值 就是“ 分位数”。简言之,在某一变量服从某一分布的条件下,对应于概率为 的变量取值就是 分位数,记为 。为了计算和应用方便,通常将概率分布密度或分布函数的取值划分为百分位区间,则分位数就可用百分位数或百分位点来度量。若 ,则 称为中位数;若 , 称为上四分位数;若 , 称为下四分位数。从分布函数的定义可以看出,它涉及到变量的累积概率问题。若从应用的角度来看,还可定义累积概率的余补概率 ,通常称为保证概率或风险概率。这一概念对研究极端气候事件特别有用,在以后的应用中,我们经常要提到这一概念。
3 气候随机变量的函数
假如已知某气候变量的概率分布,而另一变量是该变量的函数,那么我们如何来确定后者的概率及其分布?这一问题具有特别的重要性。一般说来,(理论上也已证明)随机变量的函数也是随机变量,由于人们往往并不能直接测量或观测到某些变量的实际值,而仅只观测到与这些变量有密切关系的另一些变量的实际值,但如若后者的统计特性为已知,就可通过间接的方法由后者推得前者的统计特性(如概率分布)。其重要性还在于,如果我们观测到与某些变量有密切关系的另一些变量的实际取值,那末就可通过随机变量函数的关系推得某些变量的概率分布特征。这在气象研究和业务工作中尤其重要。因为在大气科学与地球科学中大量存在着变量之间的相关现象,特别是多个变量的相互关联现象。由于多个变量之间的相互关系往往非常复杂多样,为避免冗长的数学推导,以下仅作简单介绍并分述如下:
假定 和 为具有双变量分布 的二元随机变量。现有另一对随机变量 和 与前者有函数关系式(略), 假定已知函数的逆函数通过JACOBIAN变换可得到,推求另一对随机变量的联合概率密度函数的公式。两个变量的和、差、积、商及各种线性运算,实质上就是多个随机变量函数的特例。还可得到许多这类变量的分布模式。一般可写出其分布密度表达式(略,详见概率论教科书)
(4)极大(小)值函数(次序统计量)
假设有一个随机变量X ,它是随机向量(X1,X2,...XN) 的函数。若该向量的任一个容量为N的样本 ,按大小次序排列(由小到大或由大到小次序排列得到所谓次序统计量
如记GK 是其排列样本的第K个数。这样的随机向量的函数,又称为K次序统计量。写为GK
若取第K=N ,则称为极大值函数,
若取第K=1 ,则称为极小值函数。
上述定义的极大(小)值函数,对于研究极端气候及其变化的概率特征具有重要的理论和应用价值。