|||
统计力学第二定理:关于分布成因的定理
美国归侨冯向军博士,2017年8月30日写于美丽家乡
(本文业已完成)
统计力学第二定理:产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:
deltaS = -log(p(x2))-(-log(p(x1)) (1-1)
总有:p(x1)/p/(x2) = exp(deltaS) (1-2)
概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(1-3)
概率的信息量变化deltaS = 广义的克劳修斯熵的变化 (1-4)
广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。
广义的克劳修斯熵的定义表达式是:
广义的克劳修斯熵 = -log(f(x)/a) (1-5)
这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。
概率的信息量变化deltaS = n0p0 (1-6)
这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与把变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。
证明:
因为任何具有概率p > 0的单一事件的信息量=-log(p),所以与变量值x1和x2相对应的概率p(x1)和p(x2)的信息量变化:deltaS = -log(p(x2))-(-log(p(x1)),式(1-1)成立。
由式(1-1),自然总有:p(x1)/p/(x2) = exp(deltaS),式(1-2)成立。
考察仅有两个广义能级x1和x2(x2 > x1)所组成的系统。处于能级x1上的的粒子数为n1,而处于能级x2上的粒子数为n2,n1+n2=N。当系统获得广义能量x2-x1使得在新的平衡态处于能级x1上的粒子数少了一个而处于能级x2上的粒子数多了一个。就有新旧两个平衡态所对应的系统微观状态总数W1和W2分别为:W1=N!/(n1!n2!)以及
W2=N!/((n1-1)!(n2+1)!)。因为与变量值x1和x2相对应的概率的信息量变化为:
deltaS= -log(p(x2))-(-log(p(x1))
=log(p(x1)/p(x2))=log(n1/n2),又因为广义的玻尔兹曼熵log(W)的变化
=log(W2)-log(W1)
=log(W2/W1)=log(n1/(n2+1))=log(n1/n2) (这是因为n2远大于1的缘故),就有:
概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化,式(1-3)成立。
作为热温商Q/T的狭义的克劳修斯熵是平衡态的玻尔兹曼熵。因为平衡态的玻尔兹曼熵最大,所以狭义的克劳修斯熵也就是最大的玻尔兹曼熵。所谓广义的克劳修斯熵就是与平衡态的任意给定的分布f(x)相对应的最大的广义的玻尔兹曼熵。所以由式(1-3)立即有:
概率的信息量变化deltaS = 广义的克劳修斯熵的变化,式(1-4)得证。
因为对应于玻尔兹曼分布f(Q)=aexp(-Q/(kT))的狭义的克劳修斯熵或最大的玻尔兹曼熵klog(W)=Q/T,所以狭义的克劳修斯熵的本质是狭义的克劳修斯熵=-klog(f(Q)/a)。因为
广义的玻尔兹曼熵=log(W)=玻尔兹曼熵klog(W)/k,所以对于玻尔兹曼分布,有:
广义的克劳修斯熵=狭义的克劳修斯熵/k=-log(f(Q)/a)
将上式推广至所形成的任意分布f(x)就有:
广义的克劳修斯熵=-log(f(x)/a),定义式(1-5)由此而生。因为对于所形成的分布f(x),有p(x1)=f(x1),p(x2)=f(x2),所以由式(1-5)所定义的广义的克劳修斯熵满足式(1-4)
考察由n次伯努利随机试验所组成的随机现象,它满足以下条件:1)重复进行n次随机试验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复的伯努利试验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k) (1-7)
假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p0与变量x及其等分数n成一较为复杂的待定函数关系,有:p0 =λy(x)/n, 或 np0 =λy(x)。这其中y(x)是关于变量x的待定函数。 按(1-7)式,变量间隔x之内给定事件出现的概率的分布为
P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k) (1-8)
P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-k(λy(x))k/k!(1-λy(x)/n)n
考察给定事件在变量间隔x以后才出现的概率P0(x),就有:
P0(x) = P(X=0) = (1-λy(x)/n)n (1-9)
当n->无穷大,有:
P0(x) = exp(-λy(x)) (1-10)
假设在变量间隔x以后才出现的指定事件的概率为f(x)。就有:
f(x) = exp(-λy(x))
f(x)的信息量 = -log(f(x)) = λy(x) = np0 (1-11)
概率的信息量变化deltaS=-log(f(x2)-(-log(f(x1))=n2p0-n1p0=(n2-n1)p0=n0p0
式(1-6)得证。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-18 16:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社