||
每天中国区域的面降水量最大值排名规律性的一些说明
张学文,20180215
最近在郭心怡的质疑与提示的情况下,我关于每天中国区域的面降水量最大值排名规律性的问题的认识有了一些提高。这些新认识固然不周全,但是值得初步说明一下。
l 我过去在《组成论》的研究中,指出过一个随机变量如果其几何平均值为常数,那么其概率密度分布函数,依据最大熵原理就应当是幂函数(幂分布,幂律)。
l 很多随机变量(如降水)的最大值是多少经常涉及一些工程的保证率标准问题(所谓多少年不出问题)。所以对气象变量的极值的概率分布也是特别被注意分析的对象。而很多调查说明,变量的极值与变量按大小排列数第几(名次)的关系经常符合幂函数关系,并且被称为幂律(关于名次函数的幂律)。
l 我曾经做过奥运会各国奖牌的排名,富翁按财富排名、国家按人口数量排名等多个名次与变量的关系,它们确实经常符合幂函数。在我的博客中专门有一个幂律栏目介绍我这些分析http://blog.sciencenet.cn/home.php?mod=space&uid=2024&do=blog&classid=141380&view=me&from=space 。
l 2016年8月以来,基于我国中央气象台每天提供的中国区域24小时各地降水最大的前30名的数据,我每天分析这30个挑出来的最大值做分析。它们差不多都符合幂律。这些我每天公布在博客中http://blog.sciencenet.cn/home.php?mod=space&uid=2024 。
l 最近学习气象的学生郭心怡关注了我的分析。她发现我把降水量相同的几个气象站的数据算做不同的名次的做法是不对的。她说学生的考试名次历来不是这么排的。又指出excel的rank函数也不是这样排的。而我一直沿用中央气象台提供的降水排名顺序而没有提出过质疑。
l 经过我的初步分析,这些提示有道理。即中央气象台规定的排名在降水量很少时经常出现很多小的,相同的降水量却被安排为不同的名次(而不是相同名次)的做法不妥的。
l 初步分析的结果是,修订了中央气象台对降水量的不妥的排序,其幂律规律更具有普适性。而在全国降水量很少的冬季这个问题很明显:有些日子,所谓中国降水量最大的30个降水量数据,其实降水量是0.1,0.01这些非常小的降水也被选上了,这显然是不妥的,不必要的。剔除它们比选用它们更合理。而剔除它们以后,则幂律规律明显。
l 看来我应当在中央气象台的降水最大值排序的基础上按照excel的排序规定等方法修订好排序以后再进行幂律统计分析。2018年2月14,15日我每天的中国降水分析博客就是这个过度阶段。从20180216起我会在前30名降水量中出现相同降水量时做合理处理。初步对比说明这可以值得幂律拟合的质量提高0.2(R平方值从0.7提高到0.9)。
一个参考例子见http://blog.sciencenet.cn/blog-2024-1099823.html
20180217补充说明:自2018年02月17日开始这里发表的分析都是改用经过excel 的rank函数处理的排序,而不再直接利用中央气象台网站本身提供的顺序数据。特此声明。对比显示,这提高了幂函数的关系的质量。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 22:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社