冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

关于任何特殊规律的一个的普遍原理

已有 2506 次阅读 2019-6-1 05:18 |个人分类:现代泛系|系统分类:人文社科| 现代泛系论

关于任何特殊规律的一个被人们熟视无睹的普遍或一般性原理

冯向军

06/01/2019

§1 概论

  规律,之所以称之为规律,就是变中的相对不变或相对最小变化。这种变中的相对不变或相对最小变化,用笔者所创立的《关于决定性事件的概率论》【1】的语言来说就是:

  P(任何规律)= 相对最大值    (1-1)

  这其中P是规律发生的柯尔莫哥洛夫公理化概率或发生概率。上式读做:任何规律的发生概率  P(任何规律)都是相对最大的。

  因此,关于任何特殊规律的被人们熟视无睹的一个普遍或一般性原理就是《关于决定性事件的概率论》所提出的最大概率公理:  

  凡所能发生的,都是发生概率相对最大的。发生概率不是相对最大的都不可能发生。这就是最大概率公理。

  一般而言发生概率就是事情能发生、存在或出现的概率。因为事情得以发生、存在或出现的原因以及所遵循的规律各各不同,因此发生概率的具体表现形式是多样化的。

  对于任何决定性或确定性概率分布:p1,p2,...,pn(如随机事件的平衡态概率分布或一切决定性或确定性事件的概率分布),有狭义的发生概率P的定义【1】:  

  P = p1 * p2 *...* pn        (1-2)

  对于广义系统G, p1 +  p2 + p3 +  ...+  pn = 1。

§2 统计力学的根本因果规律和自洽约束条件

  统计力学的根本因果规律就是以果为因必得果,或所谓"以果地觉为因地心则必证果”。具体来说,假设欲成就的概率分布为f(xi),又假设把以成就分布f(xi)为目标的概率分布或“因”分布pi固定为分布f(xi),则必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。 换句话说:在约束条件

pi/f(xi) = 1,i = 1,2,...,n    (2-1)

p1/f(x1) + p2/f(x2) +...+ pn/f(xn) = 常数 = n    (2-2)

下,必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。这其中,式(2-1)和式 (2-2)所规定的约束条件就叫做自洽约束条件。

§3 “科学新皇帝”最大发生概率原理

定理3.1:在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (3-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (3-2)

命目标函数中与自洽约束条件相对应的部分为T,根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (3-3)

命由T,式(3-2)所表达的自洽约束条件以及由式(3-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = T + C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi = dT/dpi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

dT/dpi = -C1 - C2/f(xi),i = 1,2,...,n。

欲令分布f(xi)成为令目标函数中与自洽约束条件相对应的部分T取最值或极值的最值分布或极值分布,必有:pi = f(xi)。于是:

dT/dpi = -C1 - C2/pi,i = 1,2,...,n。这就是说:假设把“因”分布pi固定在f(xi)上又想最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律,就必有:目标函数中与自洽约束条件相对应的部分T的一阶偏导数dT/dpi必须是概率pi的倒数的线性组合。必有:

n*T = -C1 -C2log(p1*p2...*pn) + C3,这其中C1,C2和C3为常量(本式的推导中用到了柯尔莫哥洛夫概率的规范性,或,p1+p2...+pn=1)


T = a + blog(P)    (3-4)

这其中 a = 1/n*(-C1+C3),b = -C2/n。这也就是说:唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能在把“因”分布pi固定在f(xi)上这个约束条件下令最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律。因此,在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证毕。  

定理3.2:迄今为止,除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理和最大Tsallis广义熵在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证明:因为除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理和最大Tsallis广义熵原理在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理中,在目标函数中均未包含发生概率的对数log(P),根据定理3.1,这些极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证毕。

定理3.3:“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (3-5)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (3-6)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (3-7)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (3-8)

命由目标函数T,式(3-6)所表达的自洽约束条件以及由式(3-8)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/pi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

pi = f(xi),i = 1,2,...,n。

之所以可以命C1=0,那是因为,当把“因”分布pi固定在f(xi)或pi = f(xi),i = 1,2,...n时,柯尔莫哥洛夫概率的规范性或

p1 + p2 + ... + pn = 1 已经自动得到满足的缘故。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布。这也就是说:假设把“因”分布pi固定在f(xi)上,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。这既符合最大发生概率原理又符合统计力学的根本因果规律。“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证毕。

定理3.4(类似于牛顿第二定律的统计力学第二定理的形式之一): 除自然约束条件以外的与因果律相符合的约束条件,是非均匀分布产生的原因。与因果律相符合的约束条件包括而不限于自洽约束条件:若欲成就的“果”分布为f(xi),则可命“因”分布pi 服从约束条件(i = 1,2,...n):

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数n (3-9)

证明:用完全类似于定理3.3的证明方法即可证明本定理。

定理3.5:凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。

证明:假设pi等同于分布f(xi)业已发生,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (3-10)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (3-11)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (3-12)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (3-13)

命由目标函数T,式(3-10)所表达的自洽约束条件以及由式(3-13)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/pi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

pi = f(xi),i = 1,2,...,n。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布。这也就是说:假设pi等同于分布f(xi)业已发生,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。在分布已发生的前提下,不是已发生的分布的分布或未发生的分布都不是发生概率最大的分布。这符合最大发生概率原理,也符合常识。

证毕。

§4 百花齐放百家争鸣的发生概率和广义熵同时最大原理

  我于公元2017年7月24日正式发明并在中华人民共和国科学网上首次公开发表了发生概率和广义熵同时最大原理的两种具体形式,并以此作为主流科学理论《关于决定性事件的概率论》发展史上的一个重要里程碑。有道是一重境界一重天;欲穷千里目更上一层楼。经过穿越重重迷雾而后彻见青天白日的心路历程,我现在恍然大悟:

(一)发生概率和广义熵同时最大原理才是既符合因果律又具备最广泛的实用价值的现代统计力学和热力学新世代中决定概率分布的新一代核心极值原理。她包含而超越了现代统计力学和热力学的一切基于拉格朗日乘数法的决定概率分布的极值原理。

(二)所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现(1)在概率分布得以发生的前提下发生概率最大。(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)现在终于十分清楚了,一般而言,得以发生的平衡态概率分布pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (4-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (4-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (4-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

现在业已证明:在发生概率和广义熵同时最大原理中,百花齐放,百家争鸣。除了能够给出无一切非自然约束条件下的均匀分布以外,发生概率和种种广义熵同时最大原理可以分别给出种种常见的概率分布:

(1)标准负1次幂律;

(2)负指数分布;

(3)非负1次标准幂律;

(4)Tsallis非标准非负1次幂律分布;

(5)对数分布;

(6)正态分布;

...

§4.1“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国

(一)释题

“科学新皇帝”是指主流科学理论《关于决定性事件的概率论》所提出来的决定概率分布的最大发生概率原理;齐普夫定律是指关于标准负1次幂律的用途十分广泛的齐普夫定律(Zipf's Law)。所谓“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国,则是指在所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(二)发生概率和广义熵同时最大原理

所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现

(1)在概率分布得以发生的前提下发生概率最大

(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)普适约束条件

现在终于十分清楚了,一般而言,得以发生的平衡态概率分布

pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件这三种普适约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (4.1-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (4.1-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (4.1-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

(四)最大发生概率原理

在任何约束条件下,广义系统的概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。发生概率P满足式:P = p1 * p2 *...* pn 。尽管发生概率的概念既适合于广义向量,又适合于广义系统,但是,最大发生概率原理只针对广义系统。对于广义系统, p1 +  p2 + p3 +  ...+  pn = 1。

(五)齐普夫定律简介

早在上个世纪30年代,就有人(Zipf)给出了齐普夫定律(Zipf’s Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是

r × f = C 。Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。

(六)齐普夫标准负1次幂律的特点:

齐普夫标准负1次幂律的特点是自洽约束条件同了系统约束条件:

p1x1 + p2x2 + ... + pnxn = 常量    (4.1-4)

我们知道,所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在自洽约束条件下唯独只有最大发生概率原理能够推导出作为最值或极值分布的已发生的分布,又因为对于齐普夫标准负1次幂律,自洽约束条件等同于系统约束条件,所以:在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(七)用最大发生概率原理推导出标准负1次幂律

对于标准负1次幂律pi=f(xi)=C/xi,i = 1,2,...,n,目标函数发生概率的对数log(P) = log(p1) + log(p2)+ ... + log( pn),自洽约束条件和系统约束条件(式(4.1-2)和式(4.1-3))以及自然约束条件,最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) C3)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1 + C2/f(xi) = 0

又命:

C1 = 0, C2 = -1

就有:

pi=f(xi)=C/xi    (4.1-5)

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述分布pi=f(xi)=C/xi也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布。这种标准负1次幂律符合最大发生概率原理。

(八)齐普夫定律的本质

由以上推导可见齐普夫定律的本质是:齐普夫分布或标准负1次概率分布是在系统约束条件(变量的统计平均值不变)及与之相同的自洽约束条件下,发生概率最大的分布。

§4.2 用最大发生概率原理推导均匀分布

(一)均匀分布的特点

(1)均匀分布是现代统计力学和热力学中所有基于拉格朗日乘数法的有效极值原理在且仅在自然约束条件下的唯一共同最值或极值分布。在且仅在自然约束条件下,詹尼斯最大信息熵原理、Tsallis最大广义熵原理、最大发生概率原理最小平均概率原理最小现代科学阴符数MSYFN原理以及发生概率与广义熵同时最大原理等等均以均匀分布为唯一共同最值或极值分布。

(2)均匀分布在且仅在自然约束条件下发生,这时自洽约束条件同了自然约束条件。这是因为对于所发生的均匀分布pi = 1/n,i = 1,2,...,n,有自洽约束条件:

p1/(1/n) + p2/(1/n) +...+ pn/(1/n) = n    (4.2-1)

p1 + p2 + ... + pn = 1    (4.2-2)

(二)用最大发生概率原理推导均匀分布

对于均匀分布pi=f(xi)=1/n,i = 1,2,...,n,目标函数发生概率的对数log(P) =log(p1) + log(p2)+ ... + log( pn),自洽约束条件和自然约束条件(式(4.2-2)),最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1  = 0

pi = -1/C1,i = 1,2,...,n

因为:

p1 + p2 + ... + pn = 1    

所以:

pi = 1/n,i = 1,2,...,n。C1 = -n。    

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述均匀分布pi=1/n也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布。这种均匀分布pi=1/n符合最大发生概率原理。

(三)均匀分布的物理意义

万法同归均匀分布,难道是偶然的吗?不是的!均匀分布是大自然大自在中事物的存在形式:平等遍历两两相互对立的各种广义方向。

§4.3用发生概率和广义熵同时最大原理推导负指数分布的关键步骤

(一)关键步骤

对于任何处于平衡态的系统的非均匀概率分布p1,p2,...pn而言,一般说来,均存在自然约束条件自洽约束条件和系统约束条件,这是现代统计力学和热力学的过去认识模糊且不全面的一个地方。人们只是片面地认识到这三种同时存在的约束条件中的某一种或两种,因此导致以拉格朗日乘数法为基础的种种极值原理普遍存在不自洽和有违统计力学和热力学的根本因果律等重大理论问题。

所谓自然约束条件是指:p1 + p2 + ...+ pn = 1    (4.3-1)

自然约束条件之所以普遍存在,那是因为一切服从柯尔莫哥洛夫概率公理的概率分布均具有规范性的缘故。

所谓自洽约束条件是指:

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (4.3-2)

自洽约束条件之所以在系统的平衡态普遍存在,那是因为一切在平衡态已发生的分布pi=f(xi)(i = 1,2,...,n)不再变化的缘故。

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (4.3-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

在自然约束条件、自洽约束条件和系统约束条件下,所谓推导负指数分布f(xi)=aexp(-bxi),i = 1,2,...,n,就是要在给定约束条件下,根据拉格朗日乘数法选定目标函数,以确保负指数分布f(xi)=aexp(-bxi)即是最值分布或极值分布。由此可见推导负指数分布f(xi)=aexp(-bxi)的关键步骤就是选定目标函数。因为自洽约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含发生概率的对数log(P);因为系统约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含詹尼斯信息熵,于是就有了目标函数T = 发生概率的对数log(P)+ 詹尼斯信息熵。以上就是发明发生概率信息熵同时最大原理的真实过程。

(二)用发生概率信息熵同时最大原理推导负指数分布

对于平衡态负指数分布pi=f(xi)=aexp(-bxi),i=1,2,...,n

因为:

log(P) + S = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)(目标函数)

p1/f(x1) + p2/f(x2) +...+pn/f(xn) = 常数 = n (自洽约束条件)    

p1 + p2 +...+pn = 1  (自然约束条件)

又因为:

f(xi) = aexp(-bxi),i=1,2,...,n

p1x1 + p2x2 +... + pnxn = 常量

所以:

-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) = 常量  (系统约束条件)

可构造拉格朗日算子

L = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)

+ C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) C3)

+ C4(-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi = -log(pi) -1 + 1 /pi + C1 + C2/f(xi) - C4log(f(xi))= 0,

i = 1,2,...,n。

当C1 = 1, C2 = -1,C4 = -1,有:

pi = f(xi) = aexp(-bxi),i = 1,2,...,n。        

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L一阶偏导数为零的上述负指数分布pi =aexp(-bxi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + 信息熵取得最大值或极大值的概率分布。这种负指数分布pi = aexp(-bxi)符合发生概率和信息熵同时最大原理

§4.4律成因新探与幂律分布的新推导

(一)律成因新探

幂律分布广泛存在于物理学、地球与行星科学、计算机科学、生物学、生态学、人口统计学与社会科学、经济与金融学等众多领域中,且表现形式多种多样. 在自然界与日常生活中,包括地震规模大小的分布、月球表面上月坑直径的分布、行星间碎片大小的分布 、太阳耀斑强度的分布 、计算机文件大小的分布 、战争规模的分布 、人类语言中单词频率的分布 、大多数国家姓氏的分布 、科学家撰写的论文数的分布、论文被引用的次数的分布、网页被点击次数的分布 、书籍及唱片的销售册数或张数的分布、每类生物中物种数的分布、甚至电影所获得的奥斯卡奖项数的分布等,都是典型的幂律分布。尽管关于幂律成因有种种学说,但是本人根据冯向军一般化知觉模型对几乎所有流行的信息测度的统一而创关于幂律成因的一家之言:一切主观上的感觉量和客观上的信息量都是对客观刺激量及其变化的反应的测度。客观信息量之源和主观感觉量之源都是客观刺激量及其变化。客观信息量和主观感觉量与客观刺激量之间的关系服从同一个一般模型。这个一般模型就是冯向军一般化知觉模型客观信息量的变化deltaS与刺激量ST及其变化量deltaST之间服从如下幂律关系:

deltaS = -(ST)q-2deltaST    (4.4-1)  

-客观信息量的变化deltaS / 刺激量的变化deltaST =  刺激量的幂律(ST)q-2    (4.4-2)

并且以概率p为刺激而以必然事件的概率p=1为门槛刺激量(在门槛刺激量下客观信息量为零)时,作为客观信息量的具有概率p的单个事件的Tsallis信息量就形成了:

S = 具有概率p的单个事件的Tsallis信息量 = 1/(q-1)(1 - pq-1)        (4.4-3)

作为概率分布p1,p2,...,pn的平均客观信息量的平均Tsallis信息量就是著名的Tsallis广义熵:

Tsallis广义熵 = 1/(q-1)(1 - p1q -p2q -...- pnq)    (4.4-4)

幂律的成因是:幂律是因为在系统约束条件下作为概率分布p1,p2,...,pn的平均客观信息量的Tsallis广义熵必须最大的缘故而形成的。本文在此幂律成因理论的基础上,用发生概率和Tsallis广义熵同时最大原理推导出了标准幂律。

(二)用发生概率和Tsallis广义熵同时最大原理推导标准幂律

对于平衡态标准幂律分布pi=f(xi)=axi-b,b > 0,i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (4.4-5)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (4.4-6)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (4.4-7)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pn)(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pn+

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

当C1 = 0, C2 = -1,a = (C4*(q-1)/q)1/(q-1),b = 1/(1 - q)时,有:

pi = f(xi) = axi-b    (4.4-8)   

又因为b > 0,所以q < 1。

但是当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述标准幂律分布pi=f(xi)=axi-b也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种标准幂律分布pi=f(xi)=axi-b符合发生概率和Tsallis广义同时最大原理

§4.5用发生概率和Tsallis广义熵同时最大原理推导Tsallis分布

 当你亲手推导Tsallis 分布,你才会晓得所谓Tsallis 分布是指如下所示的非标准非负1次幂律分布:

pi = a(1 -(1-q1)λxi)1/(1-q1),i = 1,2,...,n。(4.5-1)

这其中,q1 = 2 - q。

pi = a(1 -(q - 1)λxi)1/(q - 1),i = 1,2,...,n。(4.5-2)

当q -> 1 或 q1 -> 1,pi ->或还原成负指数分布aexp(-λxi),i = 1,2,...,n。

对于平衡态的Tsallis分布pi=f(xi),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (4.5-3)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (4.5-4)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (4.5-5)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pn)(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pn+

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

C2 = -1时,有:

pi = f(xi) = (C1(q-1)/q)1/(q-1)(1 + C4/C1xi)1/(q-1)

命:a = (C1(q-1)/q)1/(q-1)C4/C1 = -(q - 1)λ,有

pi = f(xi) = a(1 -(q - 1)λxi)1/(q - 1) = a(1 -(1-q1)λxi)1/(1-q1)    (4.5-6)

因为q < 1时,1/(q - 1) < 0, 又因为当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述服从式(4.5-6)的Tsallis分布pi=f(xi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种Tsallis分布pi=f(xi)符合发生概率和Tsallis广义同时最大原理

§4.6大自然的宠儿幂律分布的重要特性:因果相对变化的相似性或不变弹性

相似性是几何学或分形几何学的概念,弹性则是经济学概念。所谓因果相对变化的相似性或不变弹性在数学上指的是同一回事。

对于在自变量x处可微的表示某种因果关系的因变量或函数y=f(x),如果

dy/y = k(dx/x)    (4.6-1)

并且k为常数,就称因变量或函数y=f(x)具有因果相对变化的相似性或不变弹性。这其中dx/x是自变量或因的相对变化,而dy/y则是因变量或果的相对变化。k = (dy/y)/(dx/x),在经济学上被称为弹性或弹性系数。当k为常数时,就称k为不变弹性或不变弹性系数。

我一直在猜想:作为大自然的宠儿的幂律分布,其存在是如此广泛以致几乎到了无所不在的地步,应该总有某种重要而根本的原因吧。因为世出世间一切事都逃不出因果,所以我一直在找大自然之所以如此偏爱幂律分布的因果律方面的原因。经过多年来不懈的努力探索,我终于恍然大悟:原来幂律分布如此普遍,或许原因无他,只因为幂律分布具有因果相对变化的相似性或不变弹性而已。

非常幸运而又值得一提的是,《关于决定性事件的概率论》所发明的发生概率和广义熵同时最大原理,可以在平衡态普遍存在的自然约束条件自洽约束条件和系统约束条件下,统一推导出齐普夫定律(Zipf's Law)所描述的标准负1次幂律各种标准非负1次幂律和非标准非负1次幂律:Tsallis分布。仅因此一发明《关于决定性事件的概率论》就应该问世应世济世。

§4.7用发生概率广义熵同时最大原理推导对数分布

 对于平衡态的对数分布pi=f(xi)=log(bxi+c),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (4.7-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (4.7-2)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (4.7-3)(系统约束条件)

我们来考察如下新的目标函数发生概率的对数log(P) + T。这其中:

T = nexp(1/(a*n)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a))

当概率分布在自然约束条件下处于均匀分布时,T达到最大值零。

在变量的统计平均值不变的约束条件下,不失一般性,有:

p1(r1x1 + r2) + p2(r1x2 + r2) + ...+ pn(r1xn + r2) = 常量C (4.7-4)

这其中r1和r2是常数。又有自然约束条件:

于是拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ nexp(1/(an)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a) +

+ C1(p1 + p2 +... + pn - 1) +

+ C2(p1(r1x1 + r2)+ p2(r1x2 + r2) + ...+ pn(r1xn + r2) - C3)

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi -1/a *exp(pi/a) + C1 + C2(r1xi + r2) + C4/f(xi) = 0

当 C4 = -1,pi = f(xi) = a*log(a*(C1 + C2(r1xi + r2)))

命:

b = a*C2*r1, c = a*C1 + a*C2*r2

有:

pi = a*log(bxi + c), i = 1,2,...,n (4.7-5)

这就是对数分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(4.7-5)的对数分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P) + 广义熵T取得最大值或极大值的概率分布。这种对数分布pi符合发生概率和广义同时最大原理

对数分布的一个实用例子就是作为概率分布的归一化于宏义观控隶属度。对于作为概率分布的归一化于宏义观控隶属度,有:

xi = i,i = 1,2,...,n。

a = 1/(log(n+1)*(F(1) + F(2) + ...+ F(n)))

b = -1

c = n + 2

p(I) = a*log(n+2-I), I = 1,2,...,n (1-4)

这其中 F(I)是定性序号或名次I所对应的于宏义观控隶属度,I = 1,2,...,n。


图一  观控隶属度F(I)与定性序号或名次I之间的关系

§4.8平衡态的一般化系统约束条件

(一)平衡态的一般化系统约束条件  

在先前的篇章中,我们强调了平衡态的概率分布pi = f(xi)所普遍承受的三种约束条件:自然约束条件自洽约束条件和系统约束条件。这三种约束条件的数学表达式如下所示。

p1 + p2 + p3 +...+ pn = 1    (4.8-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n    (4.8-2)(自洽约束条件)

p1x1 + p2x2 + ... + pnxn = 常量    (4.8-3) (系统约束条件)

这其中自然约束条件自洽约束条件的形式相对不变。

但是现在看来,系统约束条件的形式不仅可以变化而且可以多样化。这是因为,在平衡态,变量概率以及整体与部分的所有关系都是确定不变的缘故。因此我们有如下平衡态的一般化系统约束条件:

p1fp(x1) + p2fp(x2) + ... + pnfp(xn) = 常量    (4.8-4) 

这其中fp(xi)是关于xi的某一符合实际和需要的函数,

i = 1,2,...,n。

上述平衡态的一般化系统约束条件将极大地扩展最大发生概率原理以及发生概率和广义熵同时最大原理的实用范围。本文将用平衡态一般化系统约束条件来推导正态分布对数正态分布等概率分布并重新推导幂律。

(二)用最大发生概率原理推导正态分布

在平衡态,固然变量的算术统计平均值可视为不变。但是任意的由确定的概率分布和与之相对应的确定的一组变量值所决定的函数fp(x),其统计平均值又何尝不可视为不变呢?一旦认可在平衡态任意函数fp(x)的统计平均值均可视为不变,那么发生概率本身也就变成了一种功能强大的决定系统状态和分布的广义熵,而最大发生概率原理本身就是一种功能强大的发生概率广义熵同时最大原理,可用来推导种种常见分布。

对于平衡态的正态分布pi=f(xi)=aexp(-b(x-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n (自洽约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a*exp(-b(xi-m)2), i = 1,2,...,n (4.8-5)

这就是正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(4.8-5)的正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种正态分布pi符合发生概率最大原理

(三)用最大发生概率原理推导对数正态分布

 对于平衡态的对数正态分布pi=f(xi)=a/xi*exp(-b(x*log(xi)-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n (自洽约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a/xi*exp(-b(log(xi)-m)2), i = 1,2,...,n (4.8-6)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(4.8-6)的对数正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种对数正态分布pi符合发生概率最大原理

(四)用最大发生概率原理重新推导幂律分布

 对于平衡态的幂律分布pi=f(xi)=axi-b,这其中a、b均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = axi-b, i = 1,2,...,n (4.8-7)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(4.8-7)的幂律分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种幂律分布pi符合发生概率最大原理

§4.统计力学第二定理:关于分布成因的定理

 统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (4.9-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (4.9-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(4.9-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (4.9-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。 

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (4.9-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (4.9-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

证明:

因为任何具有概率p > 0的单一事件的信息量=-log(p),所以变量值x1和x2相对应的概率p(x1)和p(x2)的信息量变化:deltaS = -log(p(x2))-(-log(p(x1)),式(4.9-1)成立。

由式(4.9-1),自然总有:p(x1)/p/(x2) = exp(deltaS),式(4.9-2)成立。

考察仅有两个广义能级x1和x2(x2 > x1)所组成的系统。处于能级x1上的的粒子数为n1,而处于能级x2上的粒子数为n2,n1+n2=N。当系统获得广义能量x2-x1使得在新的平衡态处于能级x1上的粒子数少了一个而处于能级x2上的粒子数多了一个。就有新旧两个平衡态所对应的系统微观状态总数W1和W2分别为:W1=N!/(n1!n2!)以及

W2=N!/((n1-1)!(n2+1)!)。因为与变量值x1和x2相对应的概率的信息量变化为:

deltaS= -log(p(x2))-(-log(p(x1))

=log(p(x1)/p(x2))=log(n1/n2),又因为广义的玻尔兹曼熵log(W)的变化

=log(W2)-log(W1)

=log(W2/W1)=log(n1/(n2+1))=log(n1/n2) (这是因为n2远大于1的缘故),就有:

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化,式(4.9-3)成立。  

作为热温商Q/T的狭义的克劳修斯熵是平衡态的玻尔兹曼熵。因为平衡态的玻尔兹曼熵最大,所以狭义的克劳修斯熵也就是最大的玻尔兹曼熵。所谓广义的克劳修斯熵就是与平衡态的任意给定的分布f(x)相对应的最大的广义的玻尔兹曼熵。所以由式(4.9-3)立即有:

概率的信息量变化deltaS = 广义的克劳修斯熵的变化,式(4.9-4)得证。

因为对应于玻尔兹曼分布f(Q)=aexp(-Q/(kT))的狭义的克劳修斯熵或最大的玻尔兹曼熵klog(W)=Q/T,所以狭义的克劳修斯熵的本质是狭义的克劳修斯熵=-klog(f(Q)/a)。因为

广义的玻尔兹曼熵=log(W)=玻尔兹曼熵klog(W)/k,所以对于玻尔兹曼分布,有:

广义的克劳修斯熵=狭义的克劳修斯熵/k=-log(f(Q)/a)

将上式推广至所形成的任意分布f(x)就有:

广义的克劳修斯熵=-log(f(x)/a),定义式(1-5)由此而生。因为对于所形成的分布f(x),有p(x1)=f(x1),p(x2)=f(x2),所以由式(1-5)所定义的广义的克劳修斯熵满足式(4.9-4)

考察由n次伯努利随机试验所组成的随机现象,它满足以下条件:1)重复进行n次随机试验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复的伯努利试验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率

P(X=k) = n!/(k!(n-k)!)p(1-p)(n-k)        (4.9-7)

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p0与变量x及其等分数n成一较为复杂的待定函数关系,有:p0 =λy(x)/n, 或 np0 =λy(x)。这其中y(x)是关于变量x的待定函数。按(4.9-7)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λy(x)/n)(1-λy(x)/n)(n-k)        (4.9-8)

P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-kλy(x))k/k!(1-λy(x)/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),就有:

P0(x) = P(X=0) = (1-λy(x)/n)n    (4.9-9)

当n->无穷大,有:

P0(x) = exp(-λy(x))    (4.9-10)

假设在变量间隔x以后才出现的指定事件的概率为f(x)。就有:

f(x) =  exp(-λy(x))

f(x)的信息量 = -log(f(x)) = λy(x) = np0    (4.9-11)

概率的信息量变化deltaS=-log(f(x2)-(-log(f(x1))=n2p0-n1p0=(n2-n1)p0=n0p0  

式(4.9-6)得证。

§4.10 彻底突破二元对立或二分性的革命性统计力学第三定理的证明及其推论

 统计力学第三定理:无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。 对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:

P = p1 * p2 *...* pn (4.10-1)

 证明:假设传统意义下的存在A = 我 =(1,0),那么就有传统意义下的存在A的对立面非A  = 非我 = (0,i * 1), i = +1 或 i = -1。这也就是:传统意义下的存在A或我与其对立面非A或非我可表达为相互垂直正交或对立的两个单位向量。不失一般性,“我”这一事件可以表达为以A和非A为基础所构成的二维正交坐标系中的归一化向量。

“我”= p1A + p2非A = p1(1,0)+ p2(0,i * 1)    (4.10-2)

这其中,p1“我”表现为A或我的概率。p2“我”表现为非A或非我的概率。p1 + p2 = 1,有:P = p(A) * p(非A/A)    (4.10-3)

这其中,P是“我”的发生概率,p(A)是“我”表现为A或我的概率,而p(非A/A)则是在“我”表现为A或我的前提下,“我”表现为非A或非我的概率。

于是:

P = p1 * p2 = p1 * (1-p1) = -(p1-0.5)+ 0.52    (4.10-4)

由此可见若按非此即彼的二元对立或二分性:要么“我”绝对是A或我,要么“我绝对是非A或非我“我”的发生概率其实都最小,等于0,因为这时p1 = 1 或 p1 = 0,按(4.10-3)式都将导致“我”的发生概率P = 0的缘故。唯有“我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“我”的发生概率才最大,这是因为 p1 = p2 = 0.5,按(4.10-3)式 将导致P取最大值0.25。此时,

“我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我   (4.10-5)

用完全类似的方法可以证明:唯有“非我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“非我”的发生概率才最大。所以按照“科学新皇帝”最大发生概率原理就必有:无任何非自然约束条件下,

“我”=“非我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我     (4.10-6)

这也就是说: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生,成就相同的“我”与“非我”:叠加态0.5A + 0.5非A 

证毕。

三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

§4.11 与牛顿力学中牛顿三大定律相对应的统计力学三大定理汇总

 统计力学第一定理在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

 统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (4.11-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (4.11-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(4.11-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (4.11-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。 

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (4.11-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (4.11-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

 统计力学第三定理: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。 以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:P = p1 * p2 *...* pn

 统计力学三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

参考文献

【1】http://blog.sciencenet.cn/blog-1968-1072135.html

【附录】

啊,伟大的拉格朗日乘数法!

冯向军

06/02/2019

(一)拉格朗日乘数法 【1】

  本词条由“科普中国”科学百科词条编写与应用工作项目 审核 。

  在数学最优问题中,拉格朗日乘数法(以数学家约瑟夫·路易斯·拉格朗日命名)是一种寻找变量受一个或多个条件所限制的多元函数极值的方法。这种方法将一个有n 个变量与k 个约束条件最优化问题转换为一个有n + k个变量的方程组的极值问题,其变量不受任何约束。这种方法引入了一种新的标量未知数,即拉格朗日乘数:约束方程的梯度(gradient)的线性组合里每个向量的系数。此方法的证明牵涉到偏微分,全微分或链法,从而找到能让设出的隐函数的微分为零的未 知数的值。

  • 中文名

  • 拉格朗日乘数法

  • 外文名

  • Lagrange Multiplier Method

  • 表达式

  • L=f(x,y,z)+λφ(x,y,z)

  • 提出者

  • Joseph Lagrange

  • 提出时间

  • 1791年

  • 定义介绍

  • 设给定二元函数z=ƒ(x,y)和附加条件φ(x,y)=0,为寻找z=ƒ(x,y)在附加条件下的极值点,先做拉格朗日函数

  •   

  • ,其中λ为参数。

  • 令F(x,y,λ)对x和y和λ的一阶偏导数等于零,即

  • F'x=ƒ'x(x,y)+λφ'x(x,y)=0

  • F'y=ƒ'y(x,y)+λφ'y(x,y)=0

  • F'λ=φ(x,y)=0

  • 由上述方程组解出x,y及λ,如此求得的(x,y),就是函数z=ƒ(x,y)在附加条件φ(x,y)=0下的可能极值点

  • 若这样的点只有一个,由实际问题可直接确定此即所求的点。

  • (二)拉格郎日乘数法的伟大

  •   拉格郎日乘数法的伟大,就在于把变量受约束的目标函数T的求极值问题,转化成了变量不受任何约束的新的目标函数T_New的求极值的问题,从而把决定性事件的一团死水变成了活水:将无数的可能性全部都纳入考量范围。在无数的可能性中确定必然性。让仅与被完全固定的变量相适应的目标函数转变为适应变量的全局的目标函数!

  • 啊,伟大的拉格朗日乘数法!你是《关于决定性事件的概率论》的数学基石!

  • 参考文献

  • 【1】百度百科,拉格朗日乘数法。https://baike.baidu.com/item/%E6%8B%89%E6%A0%BC%E6%9C%97%E6%97%A5%E4%B9%98%E6%95%B0%E6%B3%95/8550443?fr=aladdin




https://blog.sciencenet.cn/blog-1968-1182362.html

上一篇:试论周筑宝教授的最小耗能原理的一般性推广
下一篇:从禅宗名句看周筑宝教授的最小耗能原理的确暗合道妙
收藏 IP: 59.173.235.*| 热度|

1 张学文

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-9 01:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部