冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

齐普夫定律(Zipf's Law): 我爱你!

已有 9857 次阅读 2017-7-16 16:21 |个人分类:决定性概率论|系统分类:论文交流| 最大发生概率原理, 齐普夫定律(Zipf’s, Law)

齐普夫定律(Zipf's  Law): 我爱你!


美国归侨冯向军博士,2017年7月16日写于美丽家乡

我心中有个天大的秘密要对你说

苦于没有看到或视而不见确切实例

就在今天

我重新看到了

齐普夫定律(Zipf’s Law)

她就是我所需要的一切!

齐普夫定律(Zipf's  Law),叫我怎能不爱你!

【摘要】早在上个世纪30年代,就有人(Zipf)给出了齐普夫定律(Zipf’s Law)【1】:一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是 r × f = C 。Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。在n元广义系统的变量的统计平均值不变这一非自然约束条件下,《关于决定性事件的概率论》所提出的最大发生概率原理直接给出负一次幂律:齐普夫定律(Zipf’s Law)。

齐普夫定律(Zipf’s Law)的《关于决定性事件的概率论》模型

因为对n个词中的每个词都有, ri × fi = C,(i = 1,2,...,n),所以如果命概率

pi = fi,而变量xi = ri,就有

p1x1 + p2x2 + ...+ pnxn = 常量。

所以齐普夫定律(Zipf’s Law)可表达为如下定理:

定理如果概率分布p1,p2,...,pn满足非自然约束条件:变量的统计平均值是一常量,或:p1x1 + p2x2 + ...+ pnxn = 常量,那么概率分布p1,p2,...,pn一般服从负一次非标准幂律分布。在p1x1 = p2x2 =...=pnxn时,概率分布p1,p2,...,pn就服从负一次标准幂律分布。

证明

【最大发生概率原理给出负1次非标准幂律】

对于非自然约束条件:变量的统计平均值是常量 或 p1x1 + p2x2 +...+ pnxn = 常量C3(这其中x1,x2,...,xn是与广义系统概率分布p1,p2,...,pn相对应的n个离散变量值),命由目标函数发生概率的对数log(P),自然约束条件和上述非自然约束条件所决定的拉格朗日算子为L。有:

L = log(p1) + log(p2)+...+log(pn) + C1(p1 + p2 +...+ pn - 1)

+  C2(p1x1 + p2x2 +...+ pnxn - C3)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi = 1 /pi + C1 + C2xi = 0,i = 1,2,...,n。

pi = -1/(C1 + C2xi ),i = 1,2,...,n。        (1-1)

这就是负1次非标准幂律。

因为:p1x1 = p2x2 =...=pnxn = C,所以C1 = 0, C2 = -1/C。

这也就是说概率分布服从负1次标准幂律分布:

pi = C / xi,i = 1,2,...,n。        (1 - 2)

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L一阶偏导数为零的上述负1次标准幂律也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这也就是说拉格朗日算子L一阶偏导数为零的上述负1次标准幂律也必定是令约束条件下的发生概率P取得最大值或极大值的概率分布,这种负1次标准幂律符合最大发生概率原理

参考文献

【1】Zipf定律,360百科,https://baike.so.com/doc5509828-5745574.html



https://blog.sciencenet.cn/blog-1968-1066645.html

上一篇:二元绝非特例:回应张学文先生
下一篇:关于著书立《关于决定性事件的概率论》之说的正式声明
收藏 IP: 113.222.197.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 19:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部