|||
二元生克分布联系数:决定广义系统分布的广义联系数
美国归侨冯向军博士,2017年6月25日写于美丽家乡
【摘要】本文提出了广义联系数和二元生克分布联系数的概念。给出了二元生克均匀分布联系数、二元生克公平分布联系数、二元生克负指数分布联系数、二元生克幂律分布联系数和二元生克正态分布联系数的具体数学表达式。并从二元生克分布联系数这种广义联系数的角度,探讨了幂律成因等分布函数的成因。文章最后举了一个具体实例加以说明。
【定义】广义联系数,一般是指关于概率分布p1,p2,...,pn和i值的函数f:
广义联系数 = f(p1,p2,...,pn,i),这其中 i = +1 或 -1。广义联系数能够以某种方式描述广义系统G的各个以概率为坐标的广义分向量之间的相生和相克。一般而言, i = +1 或 -1不一定是标量而可以是代表某种相生态或相克态下的单位广义向量。
【定义】所谓二元生克分布联系数,是一种相对于赵克勤连续型二元联系数【1】的广义联系数。当以这种广义联系数为基础所形成的柯尔莫哥洛夫概率分布在约束条件下的信息熵最大时,一种相应的概率分布就形成了。比如:
当以二元生克均匀分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,均匀分布50%, 50% 就形成了。
当以二元生克公平分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大最大时,公平分布75%,25%就形成了。
当以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,负指数分布就形成了。
当以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,幂律分布就形成了。
当以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,正态分布就形成了。
我们有:
二元生克均匀分布联系数 = abs (p1 + i * p2) (i = + 1)
二元生克公平分布联系数 = abs (p1 + i * p2) (i = -1)
二元生克负指数分布联系数 = (p1*x1+ i * p2x2)/x1, (i = +1)。这其中x1,x2是广义系统变量的两离散值,它们的概率分别是p1, p2, x1 > x2 > 0。
二元生克幂律分布联系数 = (p1*log(x1) + i * p2log(x2))/log(x1) ,(i = +1)。这其中x1,x2是广义系统变量的两离散值,它们的概率分别是p1, p2, log(x1) > log(x2) > 0。
二元生克正态分布联系数
= (p1*(x1 - m)2 + i * p2(x2 - m)2))/(x1- m)2), (i = +1)。
这其中x1,x2是广义系统变量的两离散值,它们的概率分别是p1, p2, (x1- m)2 > (x2- m)2 > 0。
引理1:当 x->0,xlog(x)->0,这其中log为以e为底的对数。
证明:当 x->0,按罗必塔法则,xlog(x) 的极限 = (log(x)'/(1/x)')的极限 = -x的极限 = 0。
引理2:对于概率分布p1 = 1,p2 = 0,或 p1 = 0,p2 = 1,詹尼斯信息熵
E = -p1log(p1) - p2log(p2)取最小值零。
证明 E(p1) = -p1log(p1) - (1-p1)log(1-p1)
dE/dp1 = -log(p1)-1 +log(1-p1)+1
当1-p1 > p1 或 p1 < 0.5时,dE/dp1 > 0, E随p1单调递增。所以当p1->0,E取p1在【0,0.5】区间时的最小值。
当1-p1 < p1 或 p1 > 0.5时,dE/dp1 < 0, E随p1单调递减。所以当p1->1,E取p1在【0.5,1】区间时的最小值。
按引理1,对于概率分布p1 = 1,p2 = 0,或 p1 = 0,p2 = 1,詹尼斯信息熵
E = -p1log(p1) - p2log(p2)取零值。此零既是p1在【0,0.5】区间时E的最小值又是p1在【0.5,1】区间时E的最小值。
综上所述,对于概率分布p1 = 1,p2 = 0,或 p1 = 0,p2 = 1,詹尼斯信息熵
E = -p1log(p1) - p2log(p2)取最小值零。
证毕。
定理一:当以二元生克均匀分布联系数 abs (p1 + i * p2) (i = + 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,均匀分布50%, 50% 就形成了。
证明:命
psk1 = abs (p1 + i * p2) (i = + 1) = p1 + p2
psk2 = 1 - psk1
以二元生克均匀分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵为
Esk = -psk1log(psk1) - psk2log(psk2)
按引理2,在psk1 = p1 + p2 = 1 这个约束条件下。信息熵取唯一值零。故零可视为在psk1 = p1 + p2 = 1 这个约束条件下的最大熵,所以:当以二元生克均匀分布联系数 abs (p1 + i * p2) (i = + 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵在在约束条件 最大时,必然有 psk1 = p1 + p2 = 1。我们来考察原概率分布p1,p2 在psk1= p1 + p2 =1 这个自然约束条件下的必然状态。拉格朗日算子
L = -p1log(p1)-p2log(p2) + C1(p1 + p2 -1)
令一阶偏导数 dL/dpj = -log(pj)-1 + C1 = 0, j= 1,2
p1 = p2 = exp(-1 + C1),但是p1 + p2 = 1,所以 p1 = p2 = 0.5, C1 = 1 + log(0.5)。
又拉格朗日算子的二阶偏导数矩阵是一个主对角线上元素恒负而其余元素为零的对称负定矩阵,所以令一阶偏导数为零的均匀分布 p1 = p2 = 0.5也就是令拉格朗日算子或信息熵
E = -p1log(p1)-p2log(p2)最大的分布。按最大信息熵原理,原概率分布p1,p2在psk1= p1 + p2 =1 这个自然约束条件下的必然状态是均匀分布 p1 = p2 = 0.5。
综上所述,当以二元生克均匀分布联系数 abs (p1 + i * p2) (i = + 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵最小时,psk1 = p1 + p2 = 1,而在自然约束条件psk1 = p1 + p2 = 1下,原概率分布p1,p2必成均匀分布p1 = p2 = 0.5。这也就是说
当以二元生克均匀分布联系数 abs (p1 + i * p2) (i = + 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵最小时,均匀分布50%, 50% 就形成了。
证毕。
定理二:当以二元生克公平分布联系数 abs (p1 + i * p2) (i = - 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵在自然约束条件这个约束条件下最大时,公平分布75%, 25% 就形成了。
证明:假设p1 > p2,命
psk1 = abs (p1 - i * p2) (i = -1) = p1 - p2
psk2 = 1 - psk1
以二元生克公平分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵为
Esk = -psk1log(psk1) - psk2log(psk2)
当Esk在自然约束条件这个约束条件下最大时 必有psk1 = psk2 = 0.5。所以:
当以二元生克均匀分布联系数 abs (p1 + i * p2) (i = - 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵在自然约束条件这个约束条件下最大时,psk1 = p1 - p2 = 0.5。我们来考察原概率分布p1,p2 在psk1= p1 - p2 =0.5 这个约束条件下的必然状态。拉格朗日算子
L = -p1log(p1)-p2log(p2) + C1(p1 + p2 -1) + C2 (p1 - p2 - 0.5)
令一阶偏导数
dL/dp1 = -log(p1)-1 + C1 + C2 = 0,
dL/dp2= -log(p2)-1 + C1 - C2 = 0,
p1 = exp(-1 + C1 + C2)
p2 = exp(-1 + C1 - C2)
但是, p1 + p2 = 1,p1 - p2 = 0.5 所以 p1 = 0.75, p2 = 0.25,
C1 = (2 + log(0.75) + log(0.25))/2
C2 = (log(0.75) - log(0.25))/2
又拉格朗日算子的二阶偏导数矩阵是一个主对角线上元素恒负而其余元素为零的对称负定矩阵,所以令一阶偏导数为零的公平分布 p1 = 0.75, p2 = 0.25也就是令拉格朗日算子或信息熵
E = -p1log(p1)-p2log(p2)最大的分布。按最大信息熵原理,原概率分布p1,p2在psk1= p1 - p2 = 0.5 这个约束条件下的必然状态是公平分布 p1 = 0.75,p2 = 0.25。
综上所述,当以二元生克公平分布联系数 abs (p1 + i * p2) (i = -1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵最大时,psk1 = p1 - p2 = 0.5,而在约束条件psk1 = p1 - p2 = 0.5下,原概率分布p1,p2必成公平分布p1 = 0.75,p2 = 0.25。这也就是说
当以二元生克公平分布联系数 abs (p1 + i * p2) (i = - 1)为基础所形成的柯尔莫哥洛夫概率分布的信息熵在自然约束条件这个约束条件下最大时,公平分布75%, 25% 就形成了。
证毕。
定理三:当以二元生克负指数分布联系数 为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,负指数分布就形成了。
证明:命
psk1 = (p1*x1+ p2x2)/x1
psk2 = 1 - psk1
以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵为
Esk = -psk1log(psk1) - psk2log(psk2)
当Esk在约束条件下最大时 必有psk1 = 常量C3 。所以:
当以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,psk1 = (p1*x1+ p2x2)/x1 = C3 。我们来考察原概率分布p1,p2 在psk1= (p1*x1+ p2x2)/x1 = C3 这个约束条件下的必然状态。拉格朗日算子
L = -p1log(p1)-p2log(p2) + C1(p1 + p2 -1) + C2 ((p1*x1+ p2x2)/x1 - C3)
令一阶偏导数
dL/dpj = -log(pj)-1 + C1 + C2xj/x1 = 0,j = 1,2
pj = exp(-1 + C1)* exp(C2xj/x1),j = 1,2
当C2小于零时,这就是负指数分布。
又拉格朗日算子的二阶偏导数矩阵是一个主对角线上元素恒负而其余元素为零的对称负定矩阵,所以令一阶偏导数为零的负指数分布 也就是令拉格朗日算子或信息熵
E = -p1log(p1)-p2log(p2)最大的分布。按最大信息熵原理,原概率分布p1,p2在psk1= (p1*x1+ p2x2)/x1 = C3 这个约束条件下的必然状态是负指数分布。
综上所述,当以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,psk1 = (p1*x1+ p2x2)/x1 = C3 ,而在约束条件psk1 = (p1*x1+ p2x2)/x1 = C3 下,原概率分布p1,p2必成负指数分布pj = exp(-1 + C1)* exp(C2xj/x1),j = 1,2。C2 < 0 。这也就是说
当以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,负指数分布就形成了。
证毕。
定理四:当以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,幂律分布就形成了。
证明:命
psk1 = 二元生克幂律分布联系数
= (p1*log(x1) + i * p2log(x2))/log(x1),(i = +1)
psk2 = 1 - psk1
以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵为
Esk = -psk1log(psk1) - psk2log(psk2)
当Esk约束条件下最大时 必有psk1 = 常量C3 。所以:
当以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,
psk1 = (p1*log(x1) +p2log(x2))/log(x1)= C3 。
我们来考察原概率分布p1,p2 在psk1 = (p1*log(x1) +p2log(x2))/log(x1) = C3
这个约束条件下的必然状态。拉格朗日算子
L = -p1log(p1)-p2log(p2) + C1(p1 + p2 -1) + C2 ((p1*log(x1) +p2log(x2))/log(x1) - C3)
令一阶偏导数
dL/dpj = -log(pj)-1 + C1 + C2log(xj)/log(x1) = 0,j = 1,2
pj = exp(-1 + C1)* xj(C2log(xj)/log(x1)),j = 1,2
这就是幂律分布。
又拉格朗日算子的二阶偏导数矩阵是一个主对角线上元素恒负而其余元素为零的对称负定矩阵,所以令一阶偏导数为零的负指数分布 也就是令拉格朗日算子或信息熵
E = -p1log(p1)-p2log(p2)最大的分布。按最大信息熵原理,原概率分布p1,p2在psk1 = (p1*log(x1) +p2log(x2))/log(x1) = C3 这个约束条件下的必然状态是幂律分布。
综上所述,当以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,psk1 = (p1*log(x1) +p2log(x2))/log(x1) = C3 ),而在约束条件psk1 = (p1*log(x1) +p2log(x2))/log(x1) = C3 下,原概率分布p1,p2必成幂律分布pj = exp(-1 + C1)* xj(C2log(xj)/log(x1)),j = 1,2。这也就是说
当以二元生克幂律分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件下最大时,幂律分布就形成了。
证毕。
定理五:当以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件最大时,正态分布就形成了。
证明:命
psk1 = (p1*(x1 - m)2 + i * p2(x2 - m)2))/(x1- m)2), (i = +1)。
= (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2)
psk2 = 1 - psk1
以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵为
Esk = -psk1log(psk1) - psk2log(psk2)
当Esk最大时 必有psk1 = 常量C3。所以:
当以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件最大时,psk1 =
= (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2) = 常量C3 。
我们来考察原概率分布p1,p2 在
psk1 = (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2) = C3 这个约束条件下的必然状态。拉格朗日算子 L = -p1log(p1)-p2log(p2) + C1(p1 + p2 -1) +
+ C2((p1*(x1 - m)2 + p2(x2 - m)2)/(x1- m)2 - C3)
令一阶偏导数
dL/dpj = -log(pj)-1 + C1 + C2(xj - m)2)/(x1- m)2 = 0,j = 1,2
pj = exp(-1 + C1)* exp(C2(xj - m)2)/(x1- m)2),j = 1,2
当C2小于零时,这就是正态分布。
又拉格朗日算子的二阶偏导数矩阵是一个主对角线上元素恒负而其余元素为零的对称负定矩阵,所以令一阶偏导数为零的正态分布 也就是令拉格朗日算子或信息熵
E = -p1log(p1)-p2log(p2)最大的分布。按最大信息熵原理,原概率分布p1,p2在
psk1 = (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2) = C3
这个约束条件下的必然状态是正态分布。
综上所述,当以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件最大时,
psk1 = (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2 = C3
而在约束条件
psk1 = (p1*(x1 - m)2 + p2*(x2 - m)2))/(x1- m)2 = C3
下,原概率分布p1,p2必成正态分布
pj = exp(-1 + C1)* exp(C2(xj - m)2)/(x1- m)2,j = 1,2。
这也就是说当以二元生克正态分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在约束条件最大时,正态分布就形成了。
证毕。
【具体举例】
对于二元生克负指数分布联系数psk1 = (p1*x1+ p2*x2)/x1,当以二元生克负指数分布联系数为基础所形成的柯尔莫哥洛夫概率分布的信息熵在自然约束条件这个约束条件下最大时,
psk1 = (p1*x1+ p2*x2)/x1 = C3 (C3 = 0.5)
假设广义系统在二元对立的两个广义方向上的变量取值分别为:x1 = 6, x2 = 2,根据
(p1*x1+ p2*x2)/x1 = 0.5
p1 + p2 = 1
p1 = (0.5x1 - x2) / (x1 - x2)
为保证p1 > 0, 在设计过程中必须选择满足(0.5x1 - x2) > 0的x1和x2。
可得:
p1 = 1/4, p2 = 3/4
这时p1, p2 的的确确构成负指数分布:
pj = exp(-1 + C1)* exp(C2xj/x1)
p1=exp(-1+c1) * exp(c2)=1/4
p2 = exp(-1+c1)*exp(c2/3)=3/4
现将待定常数C1, C2 确定如下:
c2=-3/2 * log(3)
c1=1 + 3/2*log(3)-log(4)
p1 = 3(3/2)/4 * exp(-1/4*log(3)x1), 当 x1 = 6, p1 = 1/4
p2 = 3(3/2)/4 * exp(-1/4*log(3)x2), 当 x2 = 2, p2 = 3/4
这是个再明显不过的货真价实的标标准准的负指数分布了。这个例子说明,对于二元广义系统,只要知道变量的二个满足条件的离散值,从理论上来讲我们就能用各种二元生克联系数通过求解简单的二元一次方程组而设计出符合相应分布的概率分布。
参考文献
【1】赵克勤,北京明天下雨的贝叶斯概率向联系概率(赵森烽-克勤概率)的转换,科学网,2017年5月19日。http://blog.sciencenet.cn/blog-329317-1055866.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 23:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社