|||
名次函数的高端都符合幂律?
图如果不清楚,见WORD版:
张学文,2012/8/15
在http://blog.sciencenet.cn/blog-2024-602389.html 中我们已经提到概率分布符合幂律与随机变量的高端数据依名次排列,其名次值(第1,第2,…)与变量值在双对数坐标系下也是直线(幂函数)其含义是不一样的。
这里提供几个初步的数值试验结果,它们说明,随机变量原始的概率分布不同,可随机变量高端的变量值与名次值在双对数坐标系下都比较好的符号幂律关系。这个事实也有趣也很重要。但是其理论思路本人现在依然不清楚,欢迎指正!
我分析了三个随机变量的数据系列,它们的随机变量的出现概率分别符合幂律、负指数分布和均匀分布。我对它们分别分析其随机变量最高端(即老大、老二、…)。把变量值取对数,把排序数也取对数。分析最高端的200多数据。其共同特点是前面30个点子比较好的符合幂律,随后点子向下垂。下面是对应的图。
1000个数据符合负指数:
对这1000个数据排序,分析名次、变量值的双对数的关系,注意仅最初的部分(坐标值2以前,即前100名)符合幂律。
我还分析了数据的出现概率服从幂律分布的500个数据,其初步结论类似以上情况。即在最初的数十个数据,满足幂律。
这些就初步提出了一个问题:那些概率分布公式对应的随机变量的名次函数都具有幂律特点?为什么?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 20:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社