||
第1章:质量与面积基元等(1.2)-气象统计学私探(3)
张学文,2020 07 11
3.质量基元的气象变量统计
空气是一种连续介质。当我们说气温是20°C的时候,我们并没有明确是有多少空气具有这个温度(百叶箱里的气温是代表周围大气的,都是究竟代表多大范围,比较含糊)。但是当把不同地点,不同高度的空气作统计(如求平均气温)时,显然需要认可每个(块)相同质量的空气才有资格平等的参加统计。你总不能把1克空气的气温的10°与999克的空气气温是20度简单地把温度加起来求平均代表他们的平均温度。而只能说在1000克空气中有99.9%的空气是20度,只有千分之一的空气的温度是10度。这个百分比是根据该气温占有的空气的数量(质量,千克值)的多少统计计算出来的。所以在一些场合我们需要以对应状态的空气的质量多少来体现统计特征。
显然这种情况下的气象统计,其单位质量的空气是气象变量的统计基元。确实我们不宜统计有多少立方米的空气的气温是10度,而可以问有多少千克的气温是10度。
如果问,地球的大气的平均温度是多少?(闲话:过去的气象统计提出过这种问题吗?)
你不能说这个问题提的不当,可如何计算这个平均值?显然你不能把地面附近的气温与空气十分稀薄的高空的气温简单的加起来做平均温度。而是按不同气温的空气有多少千克,再依此做加权平均而获得全球空气的平均温度。在这种气象统计中,把空气的数量(千克值,质量数)作为统计基元才是合适的。
应当承认在过去的气象统计中,人们很少从这个角度展开统计。但是当我们把气象统计向理论科学推进的时候,以空气的质量为基元的统计的做法就显得很重要,是基础问题。在熵气象学的研究中,很多气象变量的统计都是以空气质量(重量)为统计基元的。
例如熵气象学的研究中就是这样。那里的分析指出,压力不同的空气占有的空气数量基本是相同的(统计学中的均匀分布),不同气温的空气占全球空气的总质量的百分比也近乎是相同的。
以质量为基元的气象统计可以用于本地的全空气柱的气象变量统计中。例如问在本地上空的全部大气质量中,风速为不同值的大气占了当地大气总质量的百分比是多少。也可以用于全球(半球)大气中的类似统计。如问全球大气中不同气温的空气各有多少。大气的平均气温也依靠这种统计获得答案。(具体事例见后面的有关章节)
以质量为基元的统计分析立场做法与动力气象学中的方程是列写在单位质量的空气中,是相同的。
3.面积基元的气象变量统计
我们知道大气在水平范围方面有上千,上万公里,而在铅直方向却只有数十公里。而人类都是居住在地面上。所以讨论气象状态(如气温)所笼罩的面积是个重要的统计分析角度。一场雨笼罩了多少面积?太阳在任何时刻仅能照射到半个地球面积,这些都提示我们需要把面积作为气象统计基元。
显然你去分析太阳照射了多少质量的空气不是不可以,但是这显然不如直接分析太阳照射了多少面积更鲜明。同样的,你可以去分析有多少吨,多少立方米的空气中正在产生降水,而这远不如分析现在有多少面积上的云正在下大雨或者小雨。
所以问:不同太阳高度现在笼罩了多少面积,不同雨量占有了多少面积都是科学的气象统计问题的提法。
这说明某些气象状态的统计中,选用空气质量为统计基元是不方便的,而分析该气象状态占有的面积是合适的。
应当承认,过去的气象统计,很少看到这种以面积为基元的统计。而在熵气象学中这种分析很多。
4.标准空间“格点”的气象变量统计问题
一个气象数据不仅有明确的代表时间(含时间间隔),而且有明确的代表位置。而不同不地点的百叶箱在同一时刻测量到的不同气温,当然代表着不同地址的空气温度。这里所谓不同位置泛指不同经度、纬度、高度。是的,空气存在于时间和三维的空间中。对不同位置的空气进行观测就获得了不同位置的气象状况。气象变量如何在空间中分布很重要。
这种各个空间点的气象状况数据,让我们获得了气象状态的空间分布特征。气象部门不仅发布每天的全国,或者全世界的瞬时气象状况。也大量统计全国,或者全世界各地的例如平均气温的地理分布图。这其实是把当地的气象平均值统计与气象站在地理上的布局结合到一起的一种统计-地理分析。
世界各地的气象站没有统一规定应当在哪个地理位置上。但是作为这种气象状况的地理分布最好是标准化为标准格点上的气象数据。这便于对资料的进一步加工统计。于是一些气象中心就把位置不规范的气象站数据内插到标准经纬度格点上的气象数据。然后对外公布。这种标准经纬度格点的气象数据本身就是气象统计的结果。而且它给人一种每个格点的气象统计资料具有同等的统计地位的“印象”。
但是我们需要认识到,这种标准经纬度格点上的气象数据所代表的空气质量,其实是不同的。面对这种气象资料,我们不能简单地把各个经纬度格点的气温加起来求平均就认为它是全球平均气温(同一纬圈上的统计是可以的,同一的经圈上的统计也是可以的。但是不同经纬度格点代表的面积是不同的)。因为有的格点在赤道附近,其数据代表的空气面积大,而在高纬度的格点,它代表的面积就小。所以在这种格点资料基础上开展进一步的统计,必须进一步落实其统计基元是什么。做统计要对不同纬度的数据依据代表面积相同的原则做加权处理。
在《熵气象学》一书中给出过一种处理办法。它是在低纬度附近多采集数据,在高纬度减少采集数据,从而使得每个数据代表相同面积上的气象状况。该书列出的不同纬度数据采集个数如下表(见该书24页2.2表)。
等面积基元要求下,半球天气图上各纬圈采样个数表
(每个数据代表的面积相同,赤道的一半应当属于另外半球。另外采样个数也可以进一步同比例的放大,如乘以10)
纬度 | 0 | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 合计 |
相对采样个数 | 21 | 41 | 39 | 36 | 32 | 28 | 21 | 14 | 7 | 1 | 240 |
百分比 | 0.088 | 0.171 | 0.163 | 0.150 | 0.133 | 0.117 | 0.088 | 0.058 | 0.029 | 0.004 | 1.00 |
根据以上讨论,可以看到,在全球面积上选取标准经纬度格点固然使得气象数据规范化了。但是每个气象数据代表的面积不完全相同,所以每个数据的统计权重不完全相同。
5.占有的基元数与概率的关系
我们开展的统计,其核心是计算对应的气象情况(气温,降水,风力…)的出现机会或者说概率。当统计以时间为基元时,在总共是N个时间基元中,气温为T1的情况占有的时间基元数N1越多,说明该气象状态出现的机会越大,(N1/N)就是T1状态占有 相对时间,也就是该状态在时间域的占有百分比,或者说是出现概率。它等价于在随机(任意时间)抽象中抽得此结果的事件的概率。
所以统计给出的该气象状态占有的基元数越多,其出现概率越大。这里的统计基元数可以是指时间基元,或者空气质量基元,笼罩面积基元。
不同基元下的气象统计的意义(以气温为例)
统计的基元 | 统计行为 | 概率(实为统计的百分比) |
单位时间 (如小时) | 统计当地不同气温TI,T2,…在总共N个时间段(N个基元,N小时)中分别占据了多少时间(N1,N2,…小时) | Ni/N |
单位质量 (如千克) | 统计总质量为M的空气中不同气温TI,T2,…占有的大气质量数M1,M2,…,在总共M千克空气中分别占据了多少千克空气(M1,M2,…) | Mi/M |
单位面积 (如平方公里) | 统计此区域内不同气温TI,T2,…在总面积为S的区域中分别占有了多少面积S1,S2,…, | Si/S |
6.小结
气象状态存在于地球上的大气中。地球上的大气存在于地球表层(三维空间)和一维的某时间段落中。开展气象状态的统计,需要明确这是在同一地点开展气象状况占有的时间的统计,还是开展某区域(半球,全球,某区域,下同)各气象状态中占有面积上的统计,或者气象状态占有空气质量方面的统计。或者说我们需要明确自己做的气象统计是时间基元上的统计,面积基元上的统计还是以空气质量(空气多少)为统计基元的统计。
以时间为基元开展的气象变量统计,也可以说是气象变量在时间域的统计。
以质量为基元开展的气象变量统计,也可以说是气象变量在质量域的统计。
以面积为基元开展的气象变量统计,也可以说是气象变量在面积域的统计。
由于过去的气象统计几乎都是当地的时间域的统计。以上的统计基元概念问题不突出。但是时间域的气象统计,就无法回答(例如)地球大气的平均气温是多少这种基础问题。为了回答此类具有基础意义的统计问题,就需要开展以空气质量为基元的统计。现在看来,我们完全有必要开展以空气质量,或者以占有面积为基元的统计。
由此看来,气象统计还存在很多工作(面积基元,质量基元的统计)尚没有被广泛认识到。很多气象变量的基础统计需要进一步开展!
(第1章结束)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 13:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社