|||
齐普夫定律(Zipf's Law): 我爱你!
美国归侨冯向军博士,2017年7月16日写于美丽家乡
我心中有个天大的秘密要对你说
苦于没有看到或视而不见确切实例
就在今天
我重新看到了
齐普夫定律(Zipf’s Law)
她就是我所需要的一切!
齐普夫定律(Zipf's Law),叫我怎能不爱你!
【摘要】早在上个世纪30年代,就有人(Zipf)给出了齐普夫定律(Zipf’s Law)【1】:一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是 r × f = C 。Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。在n元广义系统的变量的统计平均值不变这一非自然约束条件下,《关于决定性事件的概率论》所提出的最大发生概率原理直接给出负一次幂律:齐普夫定律(Zipf’s Law)。
【齐普夫定律(Zipf’s Law)的《关于决定性事件的概率论》模型】
因为对n个词中的每个词都有, ri × fi = C,(i = 1,2,...,n),所以如果命概率
pi = fi,而变量xi = ri,就有
p1x1 + p2x2 + ...+ pnxn = 常量。
所以齐普夫定律(Zipf’s Law)可表达为如下定理:
定理:如果概率分布p1,p2,...,pn满足非自然约束条件:变量的统计平均值是一常量,或:p1x1 + p2x2 + ...+ pnxn = 常量,那么概率分布p1,p2,...,pn一般服从负一次非标准幂律分布。在p1x1 = p2x2 =...=pnxn时,概率分布p1,p2,...,pn就服从负一次标准幂律分布。
证明:
【最大发生概率原理给出负1次非标准幂律】