冯向军的科学研究博客分享 http://blog.sciencenet.cn/u/冯向军 在本博客中专门从事以统计力学为核心的理论物理研究。

博文

《关于决定性事件的概率论》

已有 6052 次阅读 2017-7-16 19:57 |个人分类:决定性概率论|系统分类:论文交流

关于决定性事件的概率论

A Probability Theory of Decisive Events

冯向军著

Feng Xiangjun



最大概率公理

最大发生概率原理

冯向军泛有序对

冯向军知觉模型及其对信息测度的统一

对邓聚龙灰色系统建模的一些发展

对于宏义观控科学技术的一些发展

对张学文广义集合的一些发展

对赵克勤连续实区间联系数的一些发展

冯向军工作室

2017年7月16日-

代序(2017年7月24日)

非广延统计力学和热力学创始人Tsallis鼓励冯向军的亲笔信:

冯向军与Tsallis的一段鲜为人知的奇缘

国际非广延统计力学和热力学创始人Constantino Tsallis 2010年4月17日2:14分来信写道:

亲爱的冯教授:

非常感谢您寄来的所有这些个信息。

我可以看出你(们)很活跃。

我知道你们2011年9月在南京有个会议。

现在我又把你的新贡献收入非广延统计力学和热力学历史文献( 注:按the Bibliography的实际含义意译)中了。过几天就会上网。

致以最好的祝愿。

署名 C. Tsallis

巴西国家物理学研究中心理论物理部主任

巴西国家复杂系统科学技术研究所主任

from:Constantino Tsallis tsallis@cbpf.br
to:WCFSGS WCFSGS <wcfsgs@gmail.com>
date:Sat, Apr 17, 2010 at 5:14 PM
subject:Re: WCFSGS: A Special Edition On Nonextensive Statistical Mechanics
mailed-by:cbpf.br

Dear Prof. Feng,  

Thank you very much for all this information. I can see that you are very active (among others, I also see that you will have a conference in Nanjing in September 2011) Now I also included in the Bibliography this new contribution of yours.

It will be on-line in a few days.

Best regards,

C. Tsallis

自序(2017年7月16日)

 本人是民国和新中国建国初期国立复旦大学历史系名教授潘硌基教授的亲外孙华中科技大学工学博士。1994年7月5日赴美。出国前是华中科技大学的前身华中理工大学计算机系正教授。在美国工作生活的二十余年中,几乎都在美国高技术跨国公司从事高技术研究研发工作。历任美国IBM公司高级工程师/科学家美国希捷科技比兹堡研究所高级研究员日立全球存储技术公司/美国HGST公司/美国西数公司主任研发工程师。于2015年3月7日回到祖国美丽家乡做了一名美国归侨。现任家乡区侨联常委。

 算起来,本人在师从恩师张江陵教授攻读计算机存储技术专业博士学位的同时,师从恩师吴学谋教授作为第二专业研习泛系,到如今已经整整三十年了。吴学谋教授也是本人的博士论文的评审专家之一。本人在深入研修泛系的同时对邓聚龙于宏义张学文等先生的学问和学说进行了长期的承先启后继往开来的学习继承创新和发展。

 如今内心虽远离名利和名利场,却有一股强大的心灵力量催促我把我心中所悟系统地写出来,以不辜天恩、不负己灵、当仁不让、见义勇为。这就是本人决定潜心在本博(科学网上的冯向军的科学研究博客)著书立《关于决定性事件的概率论》之说的因缘。

第一章导论(2017年7月16日)

§1.1关于决定性事件的概率论

顾名思义,关于决定性事件的概率论就是把所有事件全部都当成某种意义上的决定性或确定性事件的概率理论。之所以能够把把所有事件全部都当成某种意义上的决定性或确定性事件,那是因为世间和出世间的一切事都逃不出因果关系,而因果关系是决定性的或确定性的。有因必有果。有果必有因。因就是果。果就是因。以无量的尺度来看,因果还是同时的。我们必须承认因果关系有时是很复杂的,暂时超出了人们的认识能力,因此在一定条件下不可知晓。但是绝不能因此而在观念上认为作为因果的事件是不确定的,甚至是完全不可知的。不可知是你自己在一定条件下不可知晓而已,你完全不知不代表全体宇宙生灵都完全不能知。也不能因为你对其中的因果不是很清楚,就把事件本身也观念为不确定或无决定性。

柯尔莫哥洛夫认为【1-1】:概率理论是一种特殊的测度论。概率就是对可测事件的一种测度。概率论与一般测度论相比较具有若干特征: 概率值非负且不大于1( 非负性) , 必然事件具有最大概率值1( 规范性) , 而不可能事件的概率为0。从形式观点来看, 全部概率理论可构成以“整个空间的测度为1”的特殊化测度论。 概率基点是概率空间( Q, A , P ) , Q 是基本事件ω所组成的集合, A 是Q 中集合的σ-代数, P是对所有可测事件A 有定义的概率测度。柯尔莫哥洛夫的公理化体系逐渐获得数学家的认可。随机分析的创立者伊藤清曾写道:读了柯尔莫哥洛夫的《概率论基础》, 我信服地认为概率论可用测度论来发展, 并且它和其他数学分支一样地严格。但是概率论公理化体系的构造并没有解决所有的概率论原则问题。概率论公理体系只是结合直观, 将概率的某些性质进行了公理化。关于随机性的本质这个基本问题仍未解决。随机性与确定性的界限在什么地方, 是否存在? 这个问题带有哲学性质值得关注。后来柯尔莫哥洛夫为此付出了许多努力, 试图从复杂性、信息和其它概念等方面来解决这个问题。晚年, 他提出了一个平行地研究确定性现象的复杂性和偶然性现象的统计确定性的庞大计划, 其基本思想是: 有序王国和偶然性王国之间事实上并没有一条真正的边界, 数学世界原则上是一个不可分割的整体。关于决定性事件的概率论的基本立场是:确定性现象的复杂性和偶然性现象的统计确定性可以而且应该统一用科尔莫哥洛夫概率及概率分布来测度。这是因为一切偶然性现象都是因果论层面的确定性现象的缘故。概率就是对一切可测事件的符合柯尔莫哥洛夫概率公理的一种测度,而概率分布就是对具有复杂性的可测事件的一种同时性或共时性的测度 举例来说,一张桌子上有一个萍果和两只香蕉这样的具有一定复杂性的决定性或确定性的平衡态,就对应一种符合柯尔莫哥洛夫概率公理的同时性或共时性的测度:

p1 = 1/3;

p2 = 2/3。

这其中,p1和p2是桌子上的水果的柯尔莫哥洛夫概率分布。p1 + p2 = 1。p1是桌子上的水果表现为萍果的占比这种柯尔莫哥洛夫概率,而p2是桌子上的水果同时表现为香蕉的占比这种柯尔莫哥洛夫概率。平衡态的柯尔莫哥洛夫概率分布p1和p2的客观存在与抽不抽样毫无关系。抽样一般而言是一种历时性的经验而柯尔莫哥洛夫概率分布则是一种同时性或共时性的客观测度。非但如此,抽样最好的结果也不过就是得到正确的客观存在的平衡态的柯尔莫哥洛夫概率分布p1和p2。不恰当的抽样还可能得到错误的关于客观存在的平衡态的柯尔莫哥洛夫概率分布p1和p2的测试结果。关于决定性事件的概率论认为:万事万物,一般而言,都是依某种概率分布而存在。事物在则某种概率分布在。因此万事万物的概率分布是其存在本身的重要属性而平衡态的概率分布则是事物存在本身的相对稳定的重要属性。随机事件是在一次随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件。以确定的概率分布同时具有多种不同成份的整体可称为复杂整体。随机事件是在可能令复杂整体的所有确定性的不同成份同时或一次性出现的前提下,在历时重复的随机试验中所必然出现的事件。例如,硬币是同时以确定性的均匀分布具有1/2的正面和1/2的反面的复杂整体。在掷钱币这种随机试验中,不可能同时或一次性出现正面和反面。于是必然有:(一)在随机试验掷钱币的一次试验中,正面不可能总是出现或总是不出现,正面必然是既可能出现也可能不出现这是因为复杂整体钱币本来就平等地具有正面和反面两种成份,而随机试验掷钱币又保证基本事件正面和反面等可能出现的缘故。假如本来就平等地具有正面和反面两种成份的钱币,随机试验掷钱币的一次试验,其正面居然总是出现或总是不出现,那么随机试验掷钱币就没有保证基本事件正面和反面出现的等可能性。(二)随机试验掷钱币的大量历时重复试验后统计结果必然会反映复杂整体钱币本来就平等地具有正面和反面两种成份的事实:在随机试验掷钱币保证基本事件正面和反面等可能出现的前提下,正面出现和不出现的频率都无限逼近1/2。 因此我们可以得出如下结论:1)偶然性是在不可能令复杂整体的所有确定性的不同成份同时或一次性出现的前提下,在一次随机试验中所必然出现的结果。(2)偶然性在统计上的确定性:大量历时重复的随机试验后随机事件出现频率分布的极限,必定等于复杂整体的确定性测度:概率分布。

下面的文字是对偶然性或不确定性的深层原因的浅显探索。

一张桌子上有一个萍果和二只香蕉。一眼望去就知道桌子上的水果是同时具有1/3萍果和2/3香蕉这2种成份的确定性的复杂整体,毫无不确定性或偶然性。但是当你把自己的双眼给蒙上,进行随机抽样。每次从桌子上随机抽取一个水果,又请人把所抽得的水果放回去,再重复进行随机抽样(你总可以找到一种法子保证抽样的随机性:让基本事件萍果和香蕉基本上等可能地出现)。你就会发现如下事实:

(a)每次随机抽样中,结果不可能总是抽得香蕉或抽得萍果,必然是可能抽得香蕉也可能抽得萍果。

(b)在大量而有限的重复性随机抽样以后,虽然抽得萍果和香蕉的频率仍然不确定,但抽得萍果的频率越来越接近1/3而抽得香蕉的频率越来越接近2/3。

由此我们可得出如下不失一般性的结论:

(1)真相中只有必然性或确定性而并没有偶然性或不确定性。但是真相的存在形式,一般而言,是某种以确定性的概率分布同时具有多种成份的复杂整体。

(2)偶然性或不确定性一般而言是不能反映事物真相的假相。但是经过大量重复性随机抽样等经验以后,某种偶然性不确定性(如所抽得的水果的不确定的频率分布)会越来越逼近真相中的必然性或确定性(如确定性的水果的概率分布:1/3的萍果和2/3的香蕉)。

(3)偶然性或不确定性源于象随机抽样一样的天然具有片面性的经验,这些天然具有片面性的经验包括而不限于不全面的观察和受识。从根本上来讲,偶然性或不确定性还源自对虚妄的时间和历时性经验信以为真这种虚妄相想。假如把大量重复性的随机抽样以无量尺度视为同时性或共时性的随机抽样,那么也可以基本消除所谓的偶然性或不确定性。

概率论起源于赌博问题或随机性、偶然性、不确定性问题。但是随着人们对概率的认识的深入和现实世界对概率论不断扩大的需求,概率论早已不是专门于赌博问题或随机性、偶然性、不确定性问题的理论。概率论从最初的古典概率论经由以概率是频率的极限这个概念为核心的统计概率论发展成为以科尔莫哥洛夫概率公理为核心的特殊的公理化测度理论。人们终于发现:概率论具有本体论意义,它可以用来描述本体论意义上的确定性、决定性或必然性事物普遍而客观地存在着的重要本质属性:非二元对立性或非二分性。所谓二元对立或二分性具有两大特性:(i)我执性:我就是我;非我就是非我。(ii)完全可分别性:我绝对不是非我而非我也绝对不是我。因此所谓本体论意义上的非二元对立性或非二分性自然也就具有两大绝然不同的特性:(a)非我执性:“我”不一定就是我;“非我”不一定就是非我;“我”与“非我”都以一定的概率同时既是我又是非我。(b)不完全可分别性:“我”不一定不是非我而“非我”也不一定不是我;“我”与“非我”都以一定的概率同时既是我又是非我。例如:量子力学中的薛定鄂猫就特别典型地具有非二元对立性或非二分性:薛定鄂猫的“生”或存在,以均匀概率分布同时是1/2的生和1/2的死,正好比桌子上由1个萍果和2只香蕉所组成的水果集合同时是1/3的萍果和2/3的香蕉一样。新世代的概率论,或用来描述事物普遍而客观地存在着的重要本质属性:非二元对立性或非二分性的概率论,业已成为科学的根本观念革命的数学基础。

关于决定性事件的概率论则是一种基于科尔莫哥洛夫公理化测度概率论而专门研究确定性、决定性或必然性事物中所普遍存在的测度复杂性的概率和概率分布的概率理论这其中概率和概率分布既可不涉及本体论又可成为描述本体本质属性的数学工具和基础。

关于决定性事件的概率论认为所谓偶然性或不确定性其统计却具有确定性。偶然性或不确定性的统计确定性就是偶然性或不确定性背后的真相:必然性或确定性的复杂性。频率的极限是对偶然性或不确定性的统计确定性的测度,而概率是对偶然性或不确定性背后的真相:必然性或确定性的复杂性的测度。既然偶然性或不确定性统计确定性背后的真相就是必然性或确定性的复杂性,那么频率的极限等于概率就是一件十分自然的事。非但如此,概率还是对事物真相:必然性或确定性的复杂性的最简单和最根本的测度。其理由如下所示。

(一)具有概率p的任何决定性事件E都是有一定复杂程度的广义系统

任何决定性事件E,假如它具有概率p,那么它就已然成为具有一定复杂程度的一广义系统:

E = p*(1,0)+ (1-p)*(0,1)= pA + (1-p)非A    (1.1-1)

这其中,A=(1,0)而非A=(0,1)。A与非A是相互垂直的两个单位向量,代表两个相互对立的广义方向。决定性事件E则是以A与非A为基础所构成的二维正交坐标系上的广义向量。决定性事件E在以A为单位向量的坐标轴上的投影或坐标为p,而在以非A为单位向量的坐标轴上的投影或坐标为1-p。又因为p+(1-p)=1,所以广义向量E是归一化广义向量。在《关于决定性事件的概率论》中,归一化广义向量又叫做广义系统。所以任何决定性事件E,假如它具有概率p,那么它就已然成为具有一定复杂程度的一广义系统。

(二)举例说明

假如张三为好人的概率p=70%=0.7,那么立即有:

张三 = 0.7*(1,0)+ 0.3*(0,1)= 0.7好人 + 0.3坏人

这其中好人=(1,0)而坏人=(0,1)。好人和坏人是代表两个相互对立的广义方向的单位向量。张三不是单纯的好人也不是单纯的坏人而是同时具有0.7个好人和0.3个坏人成份的具有一定复杂程度的广义系统。

(三)作为复杂度的概率p的基本特性

张三为好人的概率p=100%=1或p=0时,我们就知道张三很单纯,其复杂程度最小,要么是个纯好人要么是个纯坏人。当张三为好人的概率p=50%或p=0.5时,我们就知道张三相对而言最复杂:平等地既是半个好人又是半个坏人。

(四)从作为最简单复杂度的概率生出一切复杂度

有了概率,才有概率分布。有了概率分布才有詹尼斯广义熵张学文复杂度、发生概率、Tsallis广义熵等一切可用来描述决定性事件的复杂程度的信息测度。所以:一切复杂度皆从作为最简单复杂度的概率出生。

作为对决定性事件的复杂程度的最简单测度的概率有时甚至与作为偶然性事件的或然率的概率是直接等价的。例如,作为决定性事件复杂性测度的概率与伯努利试验或然率就存在直接等价关系。 假设盒子里有5个黑球和3个白球。那么,盒子里的球就是具有一定复杂性的确定性整体,其复杂性是同时具有5/8的黑球成份和3/8的白球成份。这其中决定性的科尔莫哥洛夫概率分布5/8和3/8就是对决定性事件盒子里的球的复杂性的测度。这其中,5/8是作为黑球成份份量的概率而3/8是作为白球成份份量的概率。 假如我们对盒子里的球进行重复性随机抽样:

(1)每次从盒子里随机抽取一个球;

(2)随后把抽取的球放回盒子;

(3)确保盒子里的每个球等可能地被抽到。

就必然有:每次重复性随机抽样都是独立的。其结局要么是黑球,要么是白球,二者必居其一。因此我们对盒子里的球所进行的重复性随机抽样就是一种伯努利试验。因为每次重复性随机抽样的结果只可能是:黑球黑球黑球黑球黑球白球白球白球中的一种,又因为伯努利试验的随机性确保盒子里的每个球等可能地被抽到,所以每次重复性随机抽样中,作为或然率的抽到黑球的概率是5/8而抽到白球的概率是3/8。显然,伯努利试验中作为或然率的抽到黑球的概率等于决定性事件盒子里的球的复杂性测度:作为黑球成份份量的概率5/8,而伯努利试验中作为或然率的抽到白球的概率等于决定性事件盒子里的球的复杂性测度:作为白球成份份量的概率3/8。对于伯努利试验,有伯努利大数定律:设fn为n重伯努利试验中事件A发生的次数,p为A在每次试验中发生的概率,则对任意给定的实数ε>0,有图片中的数学公式成立,即n趋向于无穷大时,事件A在n重伯努利试验中发生的频率fn/n无限接近于事件A在一次试验中发生的概率p。

 因此我们可以得出结论:作为决定性事件复杂性测度的概率既等于一次伯努利试验中作为或然率的某种偶然性事件发生的概率又等于当n趋向于无穷大时,某种偶然性事件在n重伯努利试验中发生的频率的极限。

 读完本书的细心的读者会知道,关于决定性事件的概率论的一个基本理论观点是:偶然性是复杂性的片面展示,而复杂性是决定性的或确定性的。复杂性是归向平等遍历的体现。在代表大自然或大自在的纯自然约束条件下,任何决定概率分布的有效极值原理均以平等遍历的均匀分布为最值或极值分布,而平等遍历则是性空的演出,可以相对于阳符或阴符称其符号为空符。

 作为一种关于概率的主流科学理论,关于决定性事件的概率论是完全彻底以国际主流科学界所普遍公认的具有非负性可加性和规范性等三大特性的柯尔莫哥洛夫公理化概率的定义【1-2】为其科学基础的。关于决定性事件的概率论中唯一新概念就是广义方向,其余全部都是基于传统逻辑传统数学和其他自然科学的。因此一切传统逻辑传统数学和其他自然科学的运算法则对于关于决定性事件的概率论都具有保守性或不变性。在这个意义上,完全可以将关于决定性事件的概率论视为传统逻辑传统数学和传统自然科学的一种分枝。

不过话又说转来。因为在传统逻辑和传统数学基础上精确定义了泛有序对(A,B)和对于它的非操作NOT,又因为直接依据关于决定性事件的概率论的唯一有别于其他科学理论的公理:最大概率公理而推导出冯向军泛有序对(A,非A),关于决定性事件的概率论又得以从传统出发而对贯穿西方思想史始终的二元对立二元论二分性【1-3】有所重大突破;对于哥德尔不完备定理【1-4】和罗素悖论【1-5】等有全新的解读。还因为唯一有别于其他科学理论的公理:最大概率公理慧眼独具别具一格,所以能够从最大概率公理出发直接发展出一整套概率论上的科学原理和方法,这其中作为信息测度的最大发生概率和最大发生概率原理就具备某些有别于詹尼斯信息熵【1-6】和Tsallis广义熵的【1-7】独一无二的特性。

因为关于决定性事件的概率论视所有事件全部都是某种意义上的决定性或确定性事件,因此也把关于所有事件的理论都视为关于决定性事件的概率论。这其中就包含把吴学谋的泛系论【1-8】、张学文的组成论【1-9】、于宏义的观控科学技术【1-10】、邓聚龙的灰色系统论【1-11】以及赵克勤的集对论【1-12】均视为关于决定性事件的概率论而加以学习、继承、创新和发展。这种承先启后继往开来的融合已涌现出一系列实实在在的新创科学研究成果。例如从吴学谋泛系(A,B)中发展出冯向军泛有序对(A,非A);把张学文广义集合发展成具有广义纠缠特性的泛有序对以及建立在泛有序对基础上的n维泛数组和泛矩阵;从于宏义的观控科学技术中发展出冯向军知觉模型及其对信息测度的统一、冯向军观控隶属度和幂律隶属度等;从邓聚龙的灰色系统建模发展出多项式累加建模等;从赵克勤连续实区间联系数迅速涌现出二元离散联系数BCN现代科学阴符数MSYFN、最小现代科学阴符均方数原理以及n元生克离散联系数等等新创科学研究成果。

总而言之关于决定性事件的概率论做到了“有容德乃大”。道法自然,完全包容传统、从传统出发而又超越传统;扬百家之精华而又有所创新和发展。在关于决定性事件的概率论的实在而深广的框架下,百花齐放,百家和鸣,共同走进历史、创造历史,迈向未来,写出崭新的科学篇章。

§1.2基本概念

§1.2.1 向量【1-13】

向量是指既有大小又有方向的量。

§1.2.2广义方向

广义方向是对空间方向的推广,是包括空间方向在内的一切可念想可分别、可执着的指向:方向意向、性向、相、性相、角度、观点立场、存在条件...等等。这其中指向的含义包括目标方向所对方位。

§1.2.3广义向量

广义向量是指既有大小又有广义方向的量。

§1.2.4单位向量

大小为1的向量叫单位向量。

§1.2.5向量的坐标表示

假设e1,e2,...,en是代表两两相互垂直、正交或对立的n个方向的n个单位向量,vi是向量Vei所代表的方向上的投影或坐标(i = 1,2,...,n),则向量V可表达为:

V = (v1,v2,...,vn)= v1e1 + v2e2 + ...+ v1en

§1.2.6广义向量的坐标表示

假设e1,e2,...,en是代表两两相互垂直、正交或对立的n个广义方向的n个单位向量,vi是广义向量GVei所代表的方向上的投影或坐标(i = 1,2,...,n),则广义向量GV可表达为:GV = (v1,v2,...,vn)= v1e1 + v2e2 + ...+ v1en,当 v1 + v2 + ...+ vn = 1,就叫广义量GV为归一化广义向量。

§1.2.7柯尔莫哥洛夫公理化概率定义

事件A的概率是对A指定的一个数P(A):

0 <= P(A) <= 1

若A是必然事件则有:

P(A) = 1

事件A与事件B互斥,则有:

P(A + B) = P(A) + P(B)

§1.2.8与事件A的概率相对应的变量

与事件A的概率相对应的变量是事件A所对应的一个描述事件A的特性的实数,变量随事件的变化而变化。

§1.2.9广义系统

在两两垂直、正交或对立的n个广义方向上有概率分布p1,p2,...,pn的事情就叫广义系统。广义系统G可表达为以概率分布p1,p2,...,pn为其坐标的归一化广义向量

G = (p1,p2,...,pn)。

§1.2.10发生概率

 一般而言发生概率就是事情能发生、存在或出现的概率。因为事情得以发生、存在或出现的原因以及所遵循的规律各各不同,因此发生概率的具体表现形式是多样化的。狭义的发生概率则是指在两两相互垂直、正交或对立的n个广义方向上分布有概率p1,p2,...,pn的广义系统G或广义向量能发生、存在或出现的概率 P = p1*p2...*pn。

§1.2.11无条件等价

如果在一切条件下A和B互相包含,则叫A和B无条件等价。

§1.2.12泛有序对(A,B)

泛有序对(A,B)是定义了无条件等价关系的抽象有序结构。如果A和C无条件等价,B和D无条件等价,则(A,B) = (C,D)。反之亦然。泛有序对(A,B)具有如下基本性质:

(1)不给定条件时具有无指向性,这其中指向的含义包括目标方向所对方位。

(2)条件不完备时具有不确定性。

(3)条件完备时具有确定性或决定性。

【举例】

不给定任何条件的抽象的(A,B)无指向。

(博士,美国归侨)含义不确定。

中国科学网上的(冯向军博士,冯向军美国归侨)含义确定。

§1.3公理和基本原理

关于决定性事件的概率论的唯一有别于其他科学理论的公理就是最大概率公理,而其基本原理就是以狭义最大发生概率原理为特色的各种最大发生概率原理

§1.4基本意向

关于决定性事件的概率论视所有事件全部都是某种意义上的决定性或确定性事件,也把关于事件的理论都视为关于决定性事件的概率论。在关于决定性事件的概率论的框架下,基于概率、概率分布、最大概率公理和各种最大发生概率原理以及求解最大发生概率所对应的概率分布的具体方法等而立关于事情的真相和真理的一家之言,吸百花之灵气扬百家之精华而又有所创新和发展,力争百花齐放、百家和鸣关于决定性事件的概率论只有开始或始觉而没有结束或止境,永远在继承探索、创新和发展的路上。

参考文献

【1-1】徐传胜,柯尔莫戈罗夫的公理化理论及其概率思想,自然辩证法研究,第26卷第5期,2010年5月。http://www.docin.com/p-1226887154.html

【1-2】刘艳丽,概率的公理化定义及其确定方法,中学数学杂志,2008年第5期。http://www.docin.com/p-798897653.html

【1-3】冯毓云二元对立思维的困境及当代思维的转型,文艺理论研究,2002年第2期。http://www.docin.com/p-855439985.html

【1-4】赵昊彤,“哥德尔不完备定理”到底说了些什么?(系列博文),科学网,2017年7月18日。http://blog.sciencenet.cn/blog-409681-1067019.html

【1-5】B.林斯基,陈磊,罗素悖论的预言者——施罗德与策梅罗,世界哲学,2013年03期。http://www.cnki.com.cn/Article/CJFDTOTAL-ZXYC201303018.htm

【1-6】 Jaynes, E. T. (1957). "Information Theory and Statistical Mechanics", Physical Review,Vol. 106,No. 4,620-630,May 15,1957. http://www.doc88.com/p-9942714807822.html

【1-7】Tsallis, C. (1988). "Possible generalization of Boltzmann-Gibbs statistics". Journal of Statistical Physics,Vol. 52,Issue 1-2, 479–487,July,1988.https://link.springer.com/article/10.1007/BF01016429

【1-8】吴学谋,《从泛系观看世界》,中国人民大学出版社,1990。http://book.kongfz.com/3615/313140993/

【1-9】张学文,《组成论》,中国科技大学出版社,2003年。http://zhangxw.gotoip1.com/ZCL/index.htm

【1-10】于宏义,泛系观控技术,道客巴巴,http://www.doc88.com/p-033416570915.html

【1-11】邓聚龙,灰色控制系统,华中工学院学报,1982年第03期。

【1-12】赵克勤,《集对分析及其初步应用》,浙江科学技术出版社,2000年3月1日出版。

【1-13】百度百科,向量。https://baike.baidu.com/item/%E5%90%91%E9%87%8F/1396519

第二章最大概率公理和最大发生概率原理

(2017年7月18日)

§2.1 最大概率公理

凡所能发生的,都是发生概率最大的。发生概率不是最大的都不可能发生。这就是最大概率公理。

一般而言发生概率就是事情能发生、存在或出现的概率。因为事情得以发生、存在或出现的原因以及所遵循的规律各各不同,因此发生概率的具体表现形式是多样化的。狭义的发生概率则是指在两两相互垂直、正交或对立的n个广义方向上分布有概率p1,p2,...,pn的广义系统G或广义向量能发生、存在或出现的概率

P = p1 * p2 *...* pn        (2.1-1)

对于广义系统G, p1 +  p2 + p3 +  ...+  pn = 1; 对于广义向量,一般而言,

p1 +  p2 + p3 + ...+ pn 不等于 1

本书中发生概率专指服从式(2.1-1)的狭义的发生概率。关于广义系统的定义请参考本书§1.2.9。假设广义系统 G = (p1,p2,...,pn),那么

G = p1(1,0,...,0)+

+ p2(0,1,...,0)+

+ ...+

+ pn(0,0,...,1)        (2.1-2)

由此可见,具有概率分布p1,p2,...,pn的广义系统要发生,就必须同时以概率p1,p2,...,pn在代表n个两两垂直、正交或对立的广义方向单位向量(1,0,...,0),(0,1,...,0),...,(0,0,...,1)上发生。因此所谓发生概率就是广义系统得以发生的概率或广义系统同时以概率p1,p2,...,pn在n个两两垂直、正交或对立的广义方向上得以发生的概率。所谓发生概率也是广义向量得以发生的概率或广义向量同时以概率p1,p2,...,pn在n个两两垂直、正交或对立的广义方向上得以发生的概率。

§2.2 最大发生概率原理

在任何约束条件下,广义系统的概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。发生概率P满足式(2.1-1):P = p1 * p2 *...* pn 。最大发生概率原理只针对广义系统。对于广义系统, p1 +  p2 + p3 +  ...+  pn = 1。

§2.3 基于最大发生概率原理的简明实用理论

发生在本书作者我身上的事实证明:基于最大发生概率的简明理论对包括如何把赚到钱的概率提高到最大在内的许许多多现实问题都很实用。这个理论对科学创新也十分有益。为了读者加深对本书最重要的概念:发生概率的感觉和理解,特以如何提高成就科学创新的概率为例,阐明基于最大发生概率的简明理论。

定理2.3.1:成就科学创新的概率最大,当且仅当你钻进科学搞科学创新又完全平等地跳出科学搞科学创新。

证明:

假设“钻进科学搞科学创新”= A = (1,0)

那么“跳出科学搞科学创新”= 非A = (0,i * 1), i = +1 或 i = -1。这也就是说若把“钻进科学搞科学创新”视为单位向量A,那么“跳出科学搞科学创新”就是与A垂直正交或对立的单位向量非A。不失一般性,“成就科学创新”这一事件可以表达为以A和非A为基础所构成的二维正交坐标系中的归一化向量。

成就科学创新”= p1A + p2非A = p1(1,0)+ p2(0,i * 1)    (2.3-1)

这其中,p1成就科学创新”表现为钻进科学搞科学创新”的概率。p2成就科学创新”表现为跳出科学搞科学创新”的概率。p1 + p2 = 1,这就是归一化的确切含义。有:P = p(A) * p(非A / A)    (2.3-2)

这其中,P是成就科学创新”的发生概率,p(A)是成就科学创新”表现为钻进科学搞科学创新”的概率,而p(非A / A)则是在成就科学创新”表现为钻进科学搞科学创新”的前提下,成就科学创新”表现为跳出科学搞科学创新”的概率。

于是:

P = p1 * p2 = p1 * (1-p1) = -(p1-0.5)2 + 0.52    (2.3-3)

由此可见若按非此即彼的二分法:要么钻进科学搞科学创新”,要么跳出科学搞科学创新”来企图成就科学创新成就科学创新”的发生概率其实都最小,等于0,因为这时p1= 1 或 p1 = 0,按(1-3)式都将导致成就科学创新”的发生概率P = 0。唯有向量子力学中的薛定鄂猫学习:钻进科学搞科学创新又完全平等地跳出科学搞科学创新成就科学创新”的发生概率才最大,这是因为 p1 = p2 = 0.5,按(2.3-3)式 将导致P取最大值0.25。

证毕。

用完全类似的方法,可以证明如下所示的定理。

定理2.3.2:你赚到钱的概率最大,当且仅当你钻进钱眼赚钱又完全平等地跳出钱眼赚钱。

定理2.3.3:得到的概率最大,当且仅当你努力去得又完全平等地努力去舍。

定理2.3.4:成功的概率最大,当且仅当你在成功中求成功又完全平等地在失败中求成功。

§2.4 发生概率的基本性质

§2.4.1 无中生有的涌现(Emergence)特性

对于具有概率分布p1,p2,...pn的n元广义系统,发生概率具有无中生有特性。对于概率分布p1,p2,...,pn及其所对应的代表广义方向的相互垂直正交或对立的单位向量A1,A2,...An,有整体的发生概率

P(p1A1 + p2A2 +...+ pnAn) = p1 * p2 * ... * pn    (2.4-1)

而无论i取什么值i = 1,2,...,n),都有部分的发生概率

P(piAi) = P(0*A1 + 0*A2 + pi*Ai...+ 0*An) = pi * 0  = 0 (2.4-2)

从式(2.4-1)和式(2.4-1)概率p1,p2,...pn全都不等于零,就可得:

P(p1A1 + p2A2 +...+ pnAn) > P(p1A1) + P(p2A2) +...+ P(pnAn) = 0    (2.4-3)

这也就是说:整体(部分之和)的发生概率大于部份的发生概率之和:零。这就是发生概率的无中生有的涌现(Emergence)特性。

§2.4.2发生概率的一个重要数理性质

定理2.4.1概率分布p1,p2,...,pn的发生概率P满足:

P  <=  (1/n)n,并且当且仅当概率分布p1,p2,...,pn呈均匀分布p1= p2=...=pn=1/n时,发生概率P才能取最大值。

证明:按几何平均值与算术平均值的关系不等式有:

P = p1p2...pn <= ((p1 + p2 +...+ pn)/n)n = (1/n)n并且当且仅当概率分布p1,p2,...,pn呈均匀分布p1=p2=...=pn=1/n时,发生概率P才能取最大值。

证毕。

§2.4.3统计力学第一定理

从定理2.4.1,容易证明如下所示的类似于牛顿第一定律的统计力学第一定理。

定理2.4.2(统计力学第一定理):在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

证明:根据定理2.4.1,在无任何非自然约束条件下,概率分布p1,p2,...,pn的发生概率P当且仅当概率分布p1,p2,...,pn呈均匀分布p1=p2=...=pn=1/n时,才能取最大值。又根据最大发生概率原理,概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。因此,在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

§2.5 统计力学的根本因果规律和自洽约束条件

统计力学的根本因果规律就是以果为因必得果,或所谓"以果地觉为因地心则必证果”。具体来说,假设欲成就的概率分布为f(xi),又假设把以成就分布f(xi)为目标的概率分布或“因”分布pi固定为分布f(xi),则必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。 换句话说:在约束条件

pi/f(xi) = 1,i = 1,2,...,n    (2.5-1)

p1/f(x1) + p2/f(x2) +...+ pn/f(xn) = 常数 = n    (2.5-2)

下,必有作为结果的分布或“果分布”的pi等于f(xi),或pi = f(xi),i = 1,2,...,n。这其中,式(2.5-1)和式 (2.5-2)所规定的约束条件就叫做自洽约束条件。

§2.6 “科学新皇帝”最大发生概率原理

定理2.6.1:在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数中与自洽约束条件相对应的部分为T,根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = T + C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi = dT/dpi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

dT/dpi = -C1 - C2/f(xi),i = 1,2,...,n。

欲令分布f(xi)成为令目标函数中与自洽约束条件相对应的部分T取最值或极值的最值分布或极值分布,必有:pi = f(xi)。于是:

dT/dpi = -C1 - C2/pi,i = 1,2,...,n。这就是说:假设把“因”分布pi固定在f(xi)上又想最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律,就必有:目标函数中与自洽约束条件相对应的部分T的一阶偏导数dT/dpi必须是概率pi的倒数的线性组合。必有:

n*T = -C1 -C2log(p1*p2...*pn) + C3,这其中C1,C2和C3为常量。

T = a + blog(P)    (2.5-4)

这其中 a = 1/n*(-C1+C3),b = -C2/n。这也就是说:唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能在把“因”分布pi固定在f(xi)上这个约束条件下令最值分布或极值分布pi = f(xi),以符合统计力学的根本因果规律。因此,在任何以拉格朗日乘数法为基础的决定概率分布的极值原理中,唯有在目标函数中至少包含发生概率的对数log(P)的极值原理才可能符合统计力学的根本因果规律,换句话说,唯有包含最大发生概率原理的极值原理才可能符合统计力学的根本因果规律。

证毕。  

定理2.6.2:迄今为止,除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理【1-5】和最大Tsallis广义熵原理【1-6】在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证明:因为除了最大发生概率原理这个"科学新皇帝”外,包括最大信息熵原理和最大Tsallis广义熵原理在内的所有其他以拉格朗日乘数法为基础的决定概率分布的极值原理中,在目标函数中均未包含发生概率的对数log(P),根据定理2.6.1,这些极值原理,一般而言,都不符合统计力学的根本因果规律,换句话说,一般而言,都是与统计力学的根本因果规律相违背的。

证毕。

定理2.6.3:“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证明:假设把“因”分布pi固定在f(xi)上,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (2.5-5)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由目标函数T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

+ C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/dpi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

dpi = f(xi),i = 1,2,...,n。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布【2-1】。这也就是说:假设把“因”分布pi固定在f(xi)上,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。这既符合最大发生概率原理又符合统计力学的根本因果规律。“科学新皇帝”最大发生概率原理与统计力学的根本因果规律自洽。

证毕。

定理2.6.4(类似于牛顿第二定律的统计力学第二定理的形式之一): 除自然约束条件以外的与因果律相符合的约束条件,是非均匀分布产生的原因。与因果律相符合的约束条件包括而不限于自洽约束条件:若欲成就的“果”分布为f(xi),则可命“因”分布pi 服从约束条件(i = 1,2,...n):

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数n (2-2)

证明:用完全类似于定理2.6.3的证明方法即可证明本定理。

定理2.6.5:凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。

证明:假设pi等同于分布f(xi)业已发生,就有:pi服从自洽约束条件:

pi/f(xi) = 1,i = 1,2,...,n。   (2.5-1)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n   (2.5-2)

命目标函数T为发生概率的对数log(P),就有:

T = lop(P) = log(p1) + log(p2) + ... + log(pn)    (2.5-5)

根据柯尔莫哥洛夫概率的规范性,有:

p1 + p2 + ... + pn = 1   (2.5-3)

命由目标函数T,式(2.5-2)所表达的自洽约束条件以及由式(2.5-3)所规定的自然约束条件所构成的拉格朗日算子为L,就有:

L = log(p1) + log(p2) + ... + log(pn) +

+ C1(p1 + p2 + ... + pn - 1) +

+ C2(p1/f(x1) + p2/f(x2) + ... + pn/f(xn) - n)

对拉格朗日算子L求一阶偏导数dL/dpi,并令之为零,就有:

dL/dpi =  1/pi + C1 + C2/f(xi) = 0,i = 1,2,...,n。

命 C1 = 0,C2 = -1,就有:

pi = f(xi),i = 1,2,...,n。

但是,拉格朗日算子L的二阶偏导数矩阵是一主对角线上元数恒负其余元素全为零的负定矩阵,所以上述令拉格朗日算子L的一阶偏导数dL/dpi为零的分布pi = f(xi)必定也是令约束条件下目标函数发生概率的对数log(P)取最大值的最大值分布【2-1】。这也就是说:假设pi等同于分布f(xi)业已发生,就有分布pi = f(xi)必定也是令约束条件下发生概率P取最大值的最大值分布。凡所发生的分布都是在分布已发生的前提下,发生概率最大的分布。在分布已发生的前提下,不是已发生的分布的分布或未发生的分布都不是发生概率最大的分布。这符合最大发生概率原理,也符合常识。

证毕。

§2.7 百花齐放百家争鸣的发生概率和广义熵同时最大原理

我于公元2017年7月24日正式发明并在中华人民共和国科学网上首次公开发表了发生概率和广义熵同时最大原理的两种具体形式【2-2】【2-3】,并以此作为主流科学理论《关于决定性事件的概率论》发展史上的一个重要里程碑。有道是一重境界一重天;欲穷千里目更上一层楼。经过穿越重重迷雾而后彻见青天白日的心路历程,我现在恍然大悟:

(一)发生概率和广义熵同时最大原理才是既符合因果律又具备最广泛的实用价值的现代统计力学和热力学新世代中决定概率分布的新一代核心极值原理。她包含而超越了现代统计力学和热力学的一切基于拉格朗日乘数法的决定概率分布的极值原理。

(二)所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现(1)在概率分布得以发生的前提下发生概率最大。(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)现在终于十分清楚了,一般而言,得以发生的平衡态概率分布pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (1-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (1-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (1-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

(四)现在业已证明:在发生概率和广义熵同时最大原理中,百花齐放,百家争鸣。除了能够给出无一切非自然约束条件下的均匀分布以外,发生概率和种种广义熵同时最大原理可以分别给出种种常见的概率分布:

(1)标准负1次幂律;

(2)负指数分布;

(3)非负1次标准幂律;

(4)Tsallis非标准非负1次幂律分布;

(5)对数分布;

(6)正态分布;

...

§2.7.1“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国

(一)释题

“科学新皇帝”是指主流科学理论《关于决定性事件的概率论》所提出来的决定概率分布的最大发生概率原理;齐普夫定律是指关于标准负1次幂律的用途十分广泛的齐普夫定律(Zipf's Law)。所谓“科学新皇帝”灵光独耀于齐普夫定律的标准负1次幂律帝国,则是指在所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(二)发生概率和广义熵同时最大原理

所谓发生概率和广义熵同时最大原理的全面而正式的表述是指:在任何约束条件下,一般而言,都必须令发生概率或发生概率和某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵之和最大,以同时实现

(1)在概率分布得以发生的前提下发生概率最大

(2)在系统约束条件等非自然约束条件下,某种包括詹尼斯信息熵和Tsallis广义熵在内的广义熵最大。

(三)普适约束条件

现在终于十分清楚了,一般而言,得以发生的平衡态概率分布

pi = f(xi),i = 1,2,...n同时满足自然约束条件,自洽约束条件和系统约束条件这三种普适约束条件。

所谓自然约束条件是指:

p1 + p2 + ...+ pn = 1    (2.7.1-1)

所谓自洽约束条件是指:

p/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (2.7.1-2)

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.1-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

(四)最大发生概率原理

在任何约束条件下,广义系统的概率分布p1,p2,...,pn要得以发生,就必须令发生概率P最大。发生概率P满足式:P = p1 * p2 *...* pn 。尽管发生概率的概念既适合于广义向量,又适合于广义系统,但是,最大发生概率原理只针对广义系统。对于广义系统, p1 +  p2 + p3 +  ...+  pn = 1。

(五)齐普夫定律简介【2-4】

早在上个世纪30年代,就有人(Zipf)给出了齐普夫定律(Zipf’s Law):一个词在一个有相当长度的语篇中的等级序号(该词在按出现次数排列的词表中的位置,他称之为rank,简称r)与该词的出现次数(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是

r × f = C 。Zipf定律是文献计量学的重要定律之一,它和罗特卡定律、布拉德福定律一起被并称为文献计量学的三大定律。Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。

(六)齐普夫标准负1次幂律的特点:

齐普夫标准负1次幂律的特点是自洽约束条件同了系统约束条件:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.1-3)

我们知道,所有基于拉格朗日乘数的现代统计力学和热力学的极值原理中,在自洽约束条件下唯独只有最大发生概率原理能够推导出作为最值或极值分布的已发生的分布,又因为对于齐普夫标准负1次幂律,自洽约束条件等同于系统约束条件,所以:在普适性的系统约束条件下唯独只有作为发生概率和广义熵同时最大原理的共同基础和重要组成部分的“科学新皇帝”最大发生概率原理能够推导出著名的齐普夫定律(Zipf's Law)。

(七)用最大发生概率原理推导出标准负1次幂律

对于标准负1次幂律pi=f(xi)=C/xi,i = 1,2,...,n,目标函数发生概率的对数log(P) =log(p1) + log(p2)+ ... + log( pn),自洽约束条件和系统约束条件(式(1-2)和式(1-3))以及自然约束条件,最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

+ C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1 + C2/f(xi) = 0

又命:

C1 = 0, C2 = -1

就有:

pi=f(xi)=C/xi    (2.7.1-4)

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述分布pi=f(xi)=C/xi也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布【2-1】。这种标准负1次幂律符合最大发生概率原理。

(八)齐普夫定律的本质

由以上推导可见齐普夫定律的本质是:齐普夫分布或标准负1次概率分布是在系统约束条件(变量的统计平均值不变)及与之相同的自洽约束条件发生概率最大的分布。

§2.7.2 用最大发生概率原理推导均匀分布

(一)均匀分布的特点

(1)均匀分布是现代统计力学和热力学中所有基于拉格朗日乘数法的有效极值原理在且仅在自然约束条件下的唯一共同最值或极值分布。在且仅在自然约束条件下,詹尼斯最大信息熵原理、Tsallis最大广义熵原理、最大发生概率原理最小平均概率原理【2-5】最小现代科学阴符数MSYFN原理【2-6】以及发生概率与广义熵同时最大原理等等均以均匀分布为唯一共同最值或极值分布。

(2)均匀分布在且仅在自然约束条件下发生,这时自洽约束条件同了自然约束条件。这是因为对于所发生的均匀分布pi = 1/n,i = 1,2,...,n,有自洽约束条件:

p1/(1/n) + p2/(1/n) +...+ pn/(1/n) = n    (1-1)

p1 + p2 + ... + pn = 1    (1-2)

(二)用最大发生概率原理推导均匀分布

对于均匀分布pi=f(xi)=1/n,i = 1,2,...,n,目标函数发生概率的对数log(P) =log(p1) + log(p2)+ ... + log( pn),自洽约束条件和自然约束条件(式(1-2)),最大发生概率原理所对应的拉格朗日算子为

L = log(p1) + log(p2)+ ... + log( pn) + C1(p1 + p2 +...+ pn - 1)

令拉格朗日算子L的一阶偏导数dL/dpi等于零,有:

dL/dpi = 1/pi + C1  = 0

pi = -1/C1,i = 1,2,...,n

因为:

p1 + p2 + ... + pn = 1    (1-2)

所以:

pi = 1/n,i = 1,2,...,n。C1 = -n。    (1-3)

但是拉格朗日算子L的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L的一阶偏导数dL/dpi为零的上述均匀分布pi=1/n也就是令约束条件下发生概率的对数log(P)或发生概率P最大的分布【2-1】。这种均匀分布pi=1/n符合最大发生概率原理。

(三)均匀分布的物理意义

万法同归均匀分布,难道是偶然的吗?不是的!均匀分布是大自然大自在中事物的存在形式:平等遍历两两相互对立的各种广义方向。

§2.7.3用发生概率和广义熵同时最大原推导负指数分布的关键步骤

(一)关键步骤

对于任何处于平衡态的系统的非均匀概率分布p1,p2,...pn而言,一般说来,均存在自然约束条件自洽约束条件和系统约束条件,这是现代统计力学和热力学的过去认识模糊且不全面的一个地方。人们只是片面地认识到这三种同时存在的约束条件中的某一种或两种,因此导致以拉格朗日乘数法为基础的种种极值原理普遍存在不自洽和有违统计力学和热力学的根本因果律等重大理论问题。

所谓自然约束条件是指:p1 + p2 + ...+ pn = 1    (2.7.3-1)

自然约束条件之所以普遍存在,那是因为一切服从科尔莫哥洛夫概率公理的概率分布均具有规范性的缘故。

所谓自洽约束条件是指:

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = 常数 = n    (2.7.3-2)

自洽约束条件之所以在系统的平衡态普遍存在,那是因为一切在平衡态已发生的分布pi=f(xi)(i = 1,2,...,n)不再变化的缘故。

所谓系统约束条件则是指:

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.3-3)

系统约束条件就是历史上著名的“变量的统计平均值不变”。之所以系统约束条件在系统平衡态普遍存在,那是因为在系统平衡态位于广义能级x上的粒子数不再变化从而令系统的总广义能量

N(p1x1 + p2x2 + ... + pnxn)(这其中N是系统宏观粒子总数)

不变的缘故。

在自然约束条件、自洽约束条件和系统约束条件下,所谓推导负指数分布f(xi)=aexp(-bxi),i = 1,2,...,n,就是要在给定约束条件下,根据拉格朗日乘数法选定目标函数,以确保负指数分布f(xi)=aexp(-bxi)即是最值分布或极值分布。由此可见推导负指数分布f(xi)=aexp(-bxi)的关键步骤就是选定目标函数。因为自洽约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含发生概率的对数log(P);因为系统约束条件,为使拉格朗日算子的一阶偏导数为零,最简单的方法就是在目标函数中包含詹尼斯信息熵,于是就有了目标函数T = 发生概率的对数log(P)+ 詹尼斯信息熵。以上就是发明发生概率信息熵同时最大原理的真实过程。

(二)用发生概率信息熵同时最大原理推导负指数分布

对于平衡态负指数分布pi=f(xi)=aexp(-bxi),i=1,2,...,n

因为:

log(P) + S = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)(目标函数)

p1/f(x1) + p2/f(x2) +...+pn/f(xn) = 常数 = n (自洽约束条件)    

p1 + p2 +...+pn = 1  (自然约束条件)

又因为:

f(xi) = aexp(-bxi),i=1,2,...,n

p1x1 + p2x2 +... + pnxn = 常量

所以:

-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) = 常量  (系统约束条件)

可构造拉格朗日算子

L = -(p1-1)log(p1) -(p2-1)log(p2)-...-(pn-1)log(pn)

+ C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(-p1log(f(x1))-p2log(f(x2))-...-pnlog(f(xn)) - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi = -log(pi) -1 + 1 /pi + C1 + C2/f(xi) - C4log(f(xi))= 0,

i = 1,2,...,n。

当C1 = 1, C2 = -1,C4 = -1,有:

pi = f(xi) = aexp(-bxi),i = 1,2,...,n。        

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵,因此令拉格朗日算子L一阶偏导数为零的上述负指数分布pi =aexp(-bxi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + 信息熵取得最大值或极大值的概率分布。这种负指数分布pi = aexp(-bxi)符合发生概率和信息熵同时最大原理

§2.7.4律成因新探与幂律分布的新推导

(一)律成因新探

幂律分布【2-7】广泛存在于物理学、地球与行星科学、计算机科学、生物学、生态学、人口统计学与社会科学、经济与金融学等众多领域中,且表现形式多种多样. 在自然界与日常生活中,包括地震规模大小的分布、月球表面上月坑直径的分布、行星间碎片大小的分布 、太阳耀斑强度的分布 、计算机文件大小的分布 、战争规模的分布 、人类语言中单词频率的分布 、大多数国家姓氏的分布 、科学家撰写的论文数的分布、论文被引用的次数的分布、网页被点击次数的分布 、书籍及唱片的销售册数或张数的分布、每类生物中物种数的分布、甚至电影所获得的奥斯卡奖项数的分布等,都是典型的幂律分布。尽管关于幂律成因有种种学说,但是本人根据冯向军一般化知觉模型对几乎所有流行的信息测度的统一而创关于幂律成因的一家之言:一切主观上的感觉量和客观上的信息量都是对客观刺激量及其变化的反应的测度。客观信息量之源和主观感觉量之源都是客观刺激量及其变化。客观信息量和主观感觉量与客观刺激量之间的关系服从同一个一般模型。这个一般模型就是冯向军一般化知觉模型【2-8】。客观信息量的变化deltaS与刺激量ST及其变化量deltaST之间服从如下幂律关系:

deltaS = -(ST)q-2deltaST    (2.7.4-1)  

-客观信息量的变化deltaS / 刺激量的变化deltaST =  刺激量的幂律(ST)q-2    (2.7.4-2)

并且以概率p为刺激而以必然事件的概率p=1为门槛刺激量(在门槛刺激量下客观信息量为零)时,作为客观信息量的具有概率p的单个事件的Tsallis信息量就形成了:

S = 具有概率p的单个事件的Tsallis信息量 = 1/(q-1)(1 - pq-1)        (2.7.4-3)

作为概率分布p1,p2,...,pn的平均客观信息量的平均Tsallis信息量就是著名的Tsallis广义熵:

Tsallis广义熵 = 1/(q-1)(1 - p1q -p2q -...- pnq)    (2.7.4-4)

幂律的成因是:幂律是因为在系统约束条件下作为概率分布p1,p2,...,pn的平均客观信息量的Tsallis广义熵必须最大的缘故而形成的。本文在此幂律成因理论的基础上,用发生概率和Tsallis广义熵同时最大原理推导出了标准幂律。

(二)用发生概率和Tsallis广义熵同时最大原理推导标准幂律

对于平衡态标准幂律分布pi=f(xi)=axi-b,b > 0,i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.4-5)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.4-6)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.4-7)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pnq )(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pnq ) +

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

当C1 = 0, C2 = -1,a = (C4*(q-1)/q)1/(q-1),b = 1/(1 - q)时,有:

pi = f(xi) = axi-b    (2.7.4-8)  

又因为b > 0,所以q < 1。

但是当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述标准幂律分布pi=f(xi)=axi-b也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种标准幂律分布pi=f(xi)=axi-b符合发生概率和Tsallis广义同时最大原理

§2.7.5用发生概率和Tsallis广义熵同时最大原理推导Tsallis分布

当你亲手推导Tsallis 分布【2-9】,你才会晓得所谓Tsallis 分布是指如下所示的非标准非负1次幂律分布:

pi = a(1 -(1-q1)λxi)1/(1-q1),i = 1,2,...,n。(2.7.5-1)

这其中,q1 = 2 - q。

pi = a(1 -(q - 1)λxi)1/(q - 1),i = 1,2,...,n。(2.7.5-2)

当q -> 1 或 q1 -> 1,pi ->或还原成负指数分布aexp(-λxi),i = 1,2,...,n。

对于平衡态的Tsallis分布pi=f(xi),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.5-3)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.5-4)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.5-5)(系统约束条件)

因为:

log(P) + S = log(p1) + log(p2) +...+ log(pn) +

+ 1/(q-1)(1 - p1q -p2q -...- pnq )(目标函数)

可构造拉格朗日算子

L = log(p1) + log(p2) +...+ log(pn) +

+  1/(q-1)(1 - p1q -p2q -...- pnq ) +

+  C1(p1 + p2 +...+ pn - 1)

+  C2(p1/f(x1) + p2/f(x2) +...+ pn/f(xn) - C3)

+ C4(p1x1 + p2x2 +...+ pnxn - C5)

对于拉格朗日算子L求一阶偏导数dL/dpi(i=1,2,...,n)并令之为零。有:

dL/dpi =  1 /pi -q/(q-1)piq-1 + C1  + C2/f(xi) + C4xi= 0,

i = 1,2,...,n。

C2 = -1时,有:

pi = f(xi) = (C1(q-1)/q)1/(q-1)(1 + C4/C1xi)1/(q-1)

命:a = (C1(q-1)/q)1/(q-1)C4/C1 = -(q - 1)λ,有

pi = f(xi) = a(1 -(q - 1)λxi)1/(q - 1) = a(1 -(1-q1)λxi)1/(1-q1)    (2.7.5-6)

因为q < 1时,1/(q - 1) < 0, 又因为当q > 0时拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,当 0 < q < 1时,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.5-6)的Tsallis分布pi=f(xi)也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数 + Tsallis广义熵取得最大值或极大值的概率分布。这种Tsallis分布pi=f(xi)符合发生概率和Tsallis广义同时最大原理

§2.7.6大自然的宠儿幂律分布的重要特性:因果相对变化的相似性或不变弹性

相似性是几何学或分形几何学的概念,弹性则是经济学概念。所谓因果相对变化的相似性或不变弹性在数学上指的是同一回事。

对于在自变量x处可微的表示某种因果关系的因变量或函数y=f(x),如果

dy/y = k(dx/x)    (2.7.6-1)

并且k为常数,就称因变量或函数y=f(x)具有因果相对变化的相似性或不变弹性。这其中dx/x是自变量或因的相对变化,而dy/y则是因变量或果的相对变化。k = (dy/y)/(dx/x),在经济学上被称为弹性或弹性系数。当k为常数时,就称k为不变弹性或不变弹性系数。

我一直在猜想:作为大自然的宠儿的幂律分布,其存在是如此广泛以致几乎到了无所不在的地步,应该总有某种重要而根本的原因吧。因为世出世间一切事都逃不出因果,所以我一直在找大自然之所以如此偏爱幂律分布的因果律方面的原因。经过多年来不懈的努力探索,我终于恍然大悟:原来幂律分布如此普遍,或许原因无他,只因为幂律分布具有因果相对变化的相似性或不变弹性而已。

非常幸运而又值得一提的是,《关于决定性事件的概率论》所发明的发生概率和广义熵同时最大原理,可以在平衡态普遍存在的自然约束条件自洽约束条件和系统约束条件下,统一推导出齐普夫定律(Zipf's Law)所描述的标准负1次幂律各种标准非负1次幂律和非标准非负1次幂律:Tsallis分布。仅因此一发明《关于决定性事件的概率论》就应该问世应世济世。

§2.7.7用发生概率广义熵同时最大原理推导对数分布

对于平衡态的对数分布pi=f(xi)=log(bxi+c),i=1,2,...,n,同时存在自然约束条件自洽约束条件和系统约束条件:

p1 + p2 +...+ pn = 1    (2.7.7-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) = 常数 = n    (2.7.7-2)(自洽约束条件)

p1x1 + p2x2 +...+ pnxn = 常量    (2.7.7-3)(系统约束条件)

我们来考察如下新的目标函数发生概率的对数log(P) + T。这其中:

T = nexp(1/(a*n)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a))

当概率分布在自然约束条件下处于均匀分布时,T达到最大值零。

在变量的统计平均值不变的约束条件下,不失一般性,有:

p1(r1x1 + r2) + p2(r1x2 + r2) + ...+ pn(r1xn + r2) = 常量C (2.7.7-4)

这其中r1和r2是常数。又有自然约束条件:

于是拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ nexp(1/(an)) -  exp(p1/a) - exp(p2/a) - ... -exp(pn/a) +

+ C1(p1 + p2 +... + pn - 1) +

+ C2(p1(r1x1 + r2)+ p2(r1x2 + r2) + ...+ pn(r1xn + r2) - C3)

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi -1/a *exp(pi/a) + C1 + C2(r1xi + r2) + C4/f(xi) = 0

当 C4 = -1,pi = f(xi) = a*log(a*(C1 + C2(r1xi + r2)))

命:

b = a*C2*r1, c = a*C1 + a*C2*r2

有:

pi = a*log(bxi + c), i = 1,2,...,n (2.7.7-5)

这就是对数分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.7-5)的对数分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P) + 广义熵T取得最大值或极大值的概率分布。这种对数分布pi符合发生概率和广义同时最大原理

对数分布的一个实用例子就是作为概率分布的归一化于宏义观控隶属度【2-10】。对于作为概率分布的归一化于宏义观控隶属度,有:

xi = i,i = 1,2,...,n。

a = 1/(log(n+1)*(F(1) + F(2) + ...+ F(n)))

b = -1

c = n + 2

p(I) = a*log(n+2-I), I = 1,2,...,n (1-4)

这其中 F(I)是定性序号或名次I所对应的于宏义观控隶属度,I = 1,2,...,n。


图一  观控隶属度F(I)与定性序号或名次I之间的关系

§2.7.8平衡态的一般化系统约束条件

(一)平衡态的一般化系统约束条件  

在先前的篇章中,我们强调了平衡态的概率分布pi = f(xi)所普遍承受的三种约束条件:自然约束条件自洽约束条件和系统约束条件。这三种约束条件的数学表达式如下所示。

p1 + p2 + p3 +...+ pn = 1    (2.7.8-1)(自然约束条件)

p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n    (2.7.8-2)(自洽约束条件)

p1x1 + p2x2 + ... + pnxn = 常量    (2.7.8-3) (系统约束条件)

这其中自然约束条件自洽约束条件的形式相对不变。

但是现在看来,系统约束条件的形式不仅可以变化而且可以多样化。这是因为,在平衡态,变量概率以及整体与部分的所有关系都是确定不变的缘故。因此我们有如下平衡态的一般化系统约束条件:

p1fp(x1) + p2fp(x2) + ... + pnfp(xn) = 常量    (2.7.8-4)

这其中fp(xi)是关于xi的某一符合实际和需要的函数,

i = 1,2,...,n。

上述平衡态的一般化系统约束条件将极大地扩展最大发生概率原理以及发生概率和广义熵同时最大原理的实用范围。本文将用平衡态一般化系统约束条件来推导正态分布对数正态分布等概率分布并重新推导幂律。

(二)用最大发生概率原理推导正态分布

在平衡态,固然变量的算术统计平均值可视为不变。但是任意的由确定的概率分布和与之相对应的确定的一组变量值所决定的函数fp(x),其统计平均值又何尝不可视为不变呢?一旦认可在平衡态任意函数fp(x)的统计平均值均可视为不变,那么发生概率本身也就变成了一种功能强大的决定系统状态和分布的广义熵,而最大发生概率原理本身就是一种功能强大的发生概率广义熵同时最大原理,可用来推导种种常见分布。

对于平衡态的正态分布pi=f(xi)=aexp(-b(x-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n (自洽约束条件)

p1/aexp(+b(x1-m)2) + p2/aexp(+b(x2-m)2) +...+

+ pn/aexp(+b(x1-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a*exp(-b(xi-m)2), i = 1,2,...,n (2.7.8-5)

这就是正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-5)的正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种正态分布pi符合发生概率最大原理

(三)用最大发生概率原理推导对数正态分布

对于平衡态的对数正态分布pi=f(xi)=a/xi*exp(-b(x*log(xi)-m)2),这其中a、b、m均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n (自洽约束条件)

p1*x/aexp(+b(log(x1)-m)2) + p2*x2/aexp(+b(log(x2)-m)2) +...+

+ pn*xn/aexp(+b(log(x1)-m)2) = n

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = a/xi*exp(-b(log(xi)-m)2), i = 1,2,...,n (2.7.8-6)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-6)的对数正态分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种对数正态分布pi符合发生概率最大原理

(四)用最大发生概率原理重新推导幂律分布

对于平衡态的幂律分布pi=f(xi)=axi-b,这其中a、b均为常量,同时存在如下所示的三种约束条件:

p1 + p2 +...+ pn = 1    (自然约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

p1/ax1+b + p2/ax2+b +...+  pn/axn+b = n (自洽约束条件)

(同了自洽约束条件的一般化系统约束条件)

自洽约束条件和同了自洽约束条件的一般化系统约束条件可统一表达为:p1/f(x1) + p2/f(x2) + ... + pn/f(xn) = n

于是最大发生概率原理所对应的拉格朗日算子为:

L = log(p1) + log(p2) + ... + log(pn)+

+ C1(p1 + p2 +... + pn - 1) +

+ C4(p1/f(x1) + p2/f(x2) + ...+ pn/f(xn) - n)

拉格朗日算子L求一阶偏导数dL/dpi并令之为零,就有:

dL/dpi = 1/pi  + C1  + C4/f(xi) = 0

当 C4 = -1,C1 = 0 ,有:

pi = f(xi) = axi-b, i = 1,2,...,n (2.7.8-7)

这就是对数正态分布。

但是拉格朗日算子L的二阶偏导数矩阵为一主对角线上元素恒负而其余元素全为零的负定对称矩阵。因此,令拉格朗日算子L一阶偏导数为零的上述服从式(2.7.8-7)的幂律分布pi也必定是令拉格朗日算子L或约束条件下的目标函数发生概率的对数log(P)取得最大值或极大值的概率分布。这种幂律分布pi符合发生概率最大原理

§2.8最大发生概率原理与波函数坍缩

§2.8.1经验两类分:共时性的全面经验和历时性的片面经验

一眼望去,你看到桌子上有一个萍果和两只香蕉。这就是一种简单的共时性的全面经验。从其本质上来看,这种简单的共时性的全面经验甚至可以堪称:“神目如电”。通过这一简单的共时性的全面经验,你就知道了:

(一)桌子上的水果的真相是决定性的或确定性的具有一定复杂程度的复杂整体:同时具有1/3的萍果和2/3的香蕉两种成份的复杂整体。

(二)概率分布就是对水果的真相:具有一定复杂程度的复杂整体的复杂程度之共时性测度。

但是对桌子上的水果的随机试验或随机抽样却是一种片面的历时性经验:

(1)每次在桌子上抽取一个水果这种一次性随机试验或随机抽样的结果必然是不确定的。这种一次随机试验或随机抽样的结果不确定的必然性恰好证明一次随机试验或随机抽样这种经验的先天不足。这种先天不足就是不能全面测度桌子上的水果的真相:决定性的或确定性的具有一定复杂程度的复杂整体。

(2)大量历时的随机试验或随机抽样又必然具有统计确定性:抽得萍果的频率的极限为1/3而抽得香蕉的频率的极限为2/3。这种统计确定性也恰好体现事情的真相:桌子上的水果的确定性的复杂程度。

如此看来所谓随机试验或随机抽样是一种片面的历时的经验。每一次随机试验或随机抽样都不能全面地测度事情的真相而大量历时的随机试验或随机抽样却能无限逼近事情的真相。

§2.8.2波函数坍缩是以作为片面的经验的测量来测度真相的必然结局

叠加原理是量子力学中的一个基本原理,它说明了波函数的性质。如果ψ1是体系的一个本征态,对应的本征值为A1ψ2是体系的另一个本征态,对应的本征值为A2,那么根据薛定鄂方程的线性性,叠加态ψ = C1ψ1 + C2ψ2也是体系一个可能的存在状态。但是在一次测量结果中,体系可能的存在状态ψ却只可能取ψ1态或ψ2态而不可能同时既是ψ1态又ψ2态,而且系统取ψ1态的概率是|C1|2而取ψ2态的概率是|C2|2如果在这个状态ψ下对可观察量A进行测量,测量到的A值也要么是A1要么是A2,测得A1A2 的概率之比为 |C1|2/ |C2|2。这就是所谓的量子态坍缩或波函数坍缩。

定理1:假如体系可能存在的叠加状态ψ以确定性概率分布同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量中要么取ψ1态要么取ψ2态,就必有:在一次测量结果中,体系可能的存在状态ψ以最大发生概率要么取ψ1态,要么取ψ2态。

证明:假设A=一次测量的结果是ψ1态而非A=一次测量的结果是ψ2态。A=(1,0)而非A=(0,1)。A与非A是代表两个相互对立的广义方向的单位向量。那么,不失一般性,总有一次测量ψ的取值的结局R = p1A + p2非A。这其中p1和p2是科尔莫哥洛夫概率分布。 对于一次测量结果R,同时存在自然约束条件、自洽约束条件和非自然约束条件。

p1 + p2 = 1    (1-1) (自然约束条件)

pi - fi = 0,i = 1或2    (1-2) (自洽约束条件)

pi - 1 = 0,i = 12  (1-3) (测量所强加的非自然约束条件)

因为目标函数为发生概率的对数log(P),可构造拉格朗日算子L

L = log(p1) + log(p2) +

+ C1(p1 + p2 -1) +

+ C2(pi - fi) +

+ C3(pi - 1)

对拉格朗日算子L求关于p1和p2以及C1,C2和C3的一阶偏导数并令之为0,就有:

1/pi + C1 + C2 + C3 = 0 ,i = 1或2   (1-4)

1/pj + C1 + C2 = 0,j = 2或1    (1-5)

p1 + p2  - 1 = 0    (1-6)

pi - fi = 0,i = 1或2    (1-7)

pi -1 = 0,i = 1或2    (1-8)

就有:

pi = fi = 1,i = 1或2

pj = fj = 0,j = 2或1。

ψ的取值的结局R是要么取ψ1态,要么取ψ2态。

但是拉格朗日算子的二阶偏导数矩阵是一主对角线上元素恒负而其余元素全为零的负定矩阵,因此上述令拉格朗日算子L一阶偏导数为零的概率分布

pi = fi = 1,i = 1,2;

pj = fj = 0,j = 2,1。

必定也是令约束条件下的发生概率的对数取最大值的分布。这种分布符合最大发生概率原理。换句话说: 假如体系可能存在的叠加状态ψ以确定性概率分布同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量中要么取ψ1态要么取ψ2态,就必有:在一次测量结果中,体系可能的存在状态ψ以最大发生概率要么取ψ1态,要么取ψ2态。

证毕。    

引理:(伯努利大数定律)设fn为n重伯努利试验中事件A发生的次数,p为A在每次试验中发生的概率,则对任意给定的实数ε>0,有图片中的数学公式成立,即n趋向于无穷大时,事件A在n重伯努利中发生的频率fn/n无限接近于事件A在一次试验中发生的概率p。


定理2:假如体系可能存在的叠加状态ψ以确定性概率分布|C1|2|C2|2同时拥有ψ1ψ2态两种成份,而作为片面的经验的测量却只允许ψ在一次测量要么以概率|C1|2ψ1态要么以概率|C2|2ψ2态,就必有经过n次重复测量且n趋向于无穷大时,测得ψψ1态的频率无限逼近|C1|2ψψ2态的频率无限逼近|C2|2

证明:由引理中所示的伯努利大数定律,定理2得证。  

§2.8.3波函数为什么会坍缩?一种非常合情合理的假说

§2.8.2前文已说道:波函数之所以必然会坍缩,是因为以作为片面的经验的测量来测度真相的必然结局。那么为什么所有的量子测量都必然是片面的呢?那是因为所有的测量本身都服从二元对立或二分性的原则。测量的前提是有对能测者和所测者的执着和分别。能测者就是能测者;所测者就是所测者;能测者绝对不是所测者而所测者也绝对不是能测者。这就是所有的量子测量本身都服从的第一个二元对立或二分性的原则。其次所有的测量本身都对所测对象同时间同空间客观存在着的相互对立的本征态1与本征态2按二元对立或二分性的原则来执着和分别:本征态1(例如薛定鄂猫的生)就是本征态1;本征态2(例如薛定鄂猫的死)就是本征态2在测量结果中绝对不允许本征态1(例如薛定鄂猫的生)同时间同空间又本征态2(例如薛定鄂猫的死);绝对不允许本征态2(例如薛定鄂猫的死)同时间同空间又本征态1(例如薛定鄂猫的生)。这就是所有的量子测量本身都服从的第二个二元对立或二分性的原则。因为所有的量子测量都服从上述两种带根本性的二元对立或二分性的原则的缘故,所有的量子测量都必然是不能同时全面地反映事情的真相的片面经验,因此必然导致波函数坍缩。

§2.9 统计力学第二定理:关于分布成因的定理

统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (2.9-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (2.9-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(2.9-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (2.9-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (2.9-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (2.9-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

证明:

因为任何具有概率p > 0的单一事件的信息量=-log(p),所以变量值x1和x2相对应的概率p(x1)和p(x2)的信息量变化:deltaS = -log(p(x2))-(-log(p(x1)),式(2.9-1)成立。

由式(1-1),自然总有:p(x1)/p/(x2) = exp(deltaS),式(2.9-2)成立。

考察仅有两个广义能级x1和x2(x2 > x1)所组成的系统。处于能级x1上的的粒子数为n1,而处于能级x2上的粒子数为n2,n1+n2=N。当系统获得广义能量x2-x1使得在新的平衡态处于能级x1上的粒子数少了一个而处于能级x2上的粒子数多了一个。就有新旧两个平衡态所对应的系统微观状态总数W1和W2分别为:W1=N!/(n1!n2!)以及

W2=N!/((n1-1)!(n2+1)!)。因为与变量值x1和x2相对应的概率的信息量变化为:

deltaS= -log(p(x2))-(-log(p(x1))

=log(p(x1)/p(x2))=log(n1/n2),又因为广义的玻尔兹曼熵log(W)的变化

=log(W2)-log(W1)

=log(W2/W1)=log(n1/(n2+1))=log(n1/n2) (这是因为n2远大于1的缘故),就有:

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化,式(2.9-3)成立。  

作为热温商Q/T的狭义的克劳修斯熵是平衡态的玻尔兹曼熵。因为平衡态的玻尔兹曼熵最大,所以狭义的克劳修斯熵也就是最大的玻尔兹曼熵。所谓广义的克劳修斯熵就是与平衡态的任意给定的分布f(x)相对应的最大的广义的玻尔兹曼熵。所以由式(2.9-3)立即有:

概率的信息量变化deltaS = 广义的克劳修斯熵的变化,式(2.9-4)得证。

因为对应于玻尔兹曼分布f(Q)=aexp(-Q/(kT))的狭义的克劳修斯熵或最大的玻尔兹曼熵klog(W)=Q/T,所以狭义的克劳修斯熵的本质是狭义的克劳修斯熵=-klog(f(Q)/a)。因为

广义的玻尔兹曼熵=log(W)=玻尔兹曼熵klog(W)/k,所以对于玻尔兹曼分布,有:

广义的克劳修斯熵=狭义的克劳修斯熵/k=-log(f(Q)/a)

将上式推广至所形成的任意分布f(x)就有:

广义的克劳修斯熵=-log(f(x)/a),定义式(1-5)由此而生。因为对于所形成的分布f(x),有p(x1)=f(x1),p(x2)=f(x2),所以由式(1-5)所定义的广义的克劳修斯熵满足式(2.9-4)

考察由n次伯努利随机试验所组成的随机现象,它满足以下条件:1)重复进行n次随机试验;2)n次实验相互独立;3)每次实验仅有两个可能结果;4)每次实验中给定事件出现的概率为p,不出现的概率为1-p。假设X表示n次独立重复的伯努利试验中给定事件出现的次数,显然X是可以取0,1,…,n等n+1个值的离散随机变量。设这n次实验中,每个“给定事件出现k次的结果”为Ek,显然Ek的发生概率为pk(1-p)n-k。因为这样的结果有:n!/k!(n-k)!个,所以按照柯尔莫哥洛夫概率的可加性,这n次实验中,给定事件出现k次的概率

P(X=k) = n!/(k!(n-k)!)pk (1-p)(n-k)        (2.9-7)

假设把变量x等分成n个变量片段。当n足够大时,在每个等分变量片段上给定事件要么出现1次,要么不出现。又假设给定事件出现(1次)的概率p0与变量x及其等分数n成一较为复杂的待定函数关系,有:p0 =λy(x)/n,np0 =λy(x)。这其中y(x)是关于变量x的待定函数。 按(1-7)式,变量间隔x之给定事件出现的概率的分布为

P(X = k) = n!/(k!(n-k)!)(λy(x)/n)k (1-λy(x)/n)(n-k)        (2.9-8)

P(X = k) = n!/(nk(n-k)!)(1-λy(x)/n)-kλy(x))k/k!(1-λy(x)/n)n

考察给定事件在变量间隔x以后才出现的概率P0(x),就有:

P0(x) = P(X=0) = (1-λy(x)/n)n    (2.9-9)

当n->无穷大,有:

P0(x) = exp(-λy(x))    (2.9-10)

假设在变量间隔x以后才出现的指定事件的概率为f(x)。就有:

f(x) =  exp(-λy(x))

f(x)的信息量 = -log(f(x)) = λy(x) = np0    (2.9-11)

概率的信息量变化deltaS=-log(f(x2)-(-log(f(x1))=n2p0-n1p0=(n2-n1)p0=n0p0  

式(2.9-6)得证。

§2.10 彻底突破二元对立或二分性的革命性统计力学第三定理的证明及其推论

统计力学第三定理:无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。 对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:

P = p1 * p2 *...* pn (2.10-1)

证明:假设传统意义下的存在A = 我 =(1,0),那么就有传统意义下的存在A的对立面非A  = 非我 = (0,i * 1), i = +1 或 i = -1。这也就是:传统意义下的存在A或我与其对立面非A或非我可表达为相互垂直正交或对立的两个单位向量。不失一般性,“我”这一事件可以表达为以A和非A为基础所构成的二维正交坐标系中的归一化向量。

“我”= p1A + p2非A = p1(1,0)+ p2(0,i * 1)    (2.10-2)

这其中,p1“我”表现为A或我的概率。p2“我”表现为非A或非我的概率。p1 + p2 = 1,有:P = p(A) * p(非A/A)    (2.10-3)

这其中,P是“我”的发生概率,p(A)是“我”表现为A或我的概率,而p(非A/A)则是在“我”表现为A或我的前提下,“我”表现为非A或非我的概率。

于是:

P = p1 * p2 = p1 * (1-p1) = -(p1-0.5)2 + 0.52    (2.10-4)

由此可见若按非此即彼的二元对立或二分性:要么“我”绝对是A或我,要么“我绝对是非A或非我“我”的发生概率其实都最小,等于0,因为这时p1 = 1 或 p1 = 0,按(2.10-3)式都将导致“我”的发生概率P = 0的缘故。唯有“我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“我”的发生概率才最大,这是因为 p1 = p2 = 0.5,按(2.10-3)式 将导致P取最大值0.25。此时,

“我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我   (2.10-5)

用完全类似的方法可以证明:唯有“非我”是以0.5的概率具有A或我的成份又完全平等地以0.5的概率具有非A或非我的成份“非我”的发生概率才最大。所以按照“科学新皇帝”最大发生概率原理就必有:无任何非自然约束条件下,

“我”=“非我”= 叠加态0.5A + 0.5非A = 0.5我 + 0.5非我     (2.10-6)

这也就是说: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生,成就相同的“我”与“非我”:叠加态0.5A + 0.5非A

证毕。

三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

§2.11 与牛顿力学中牛顿三大定律相对应的统计力学三大定理汇总

统计力学第一定理在无任何非自然约束条件下,一切分布均以最大发生概率成为均匀分布。

统计力学第二定理产生概率p(x)变化的原因是与变量值x1和x2相对应的概率的信息量变化:

deltaS = -log(p(x2))-(-log(p(x1))    (2.11-1)

总有:p(x1)/p/(x2) = exp(deltaS)    (2.11-2)

概率的信息量变化deltaS = 广义的玻尔兹曼熵log(W)的变化(2.11-3)

概率的信息量变化deltaS = 广义的克劳修斯熵的变化    (2.11-4)

广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化。

广义的克劳修斯熵的定义表达式是:

广义的克劳修斯熵 = -log(f(x)/a)    (2.11-5)

这其中f(x)是所产生的分布,f(x) = af1(x),而f1(x)=f(x)/a 则是所产生的分布的形态。广义的玻尔兹曼熵是系统微观状态总数,实际上代表一种发生概率。广义的克劳修斯熵是平衡态的或最大的广义的玻尔兹曼熵,因此代表一种最大的发生概率。以广义的玻尔兹曼熵log(W)的变化 = 广义的克劳修斯熵的变化来决定概率分布实际上是一种最大发生概率原理。

概率的信息量变化deltaS = n0p0    (2.11-6)

这其中,W是系统的微观状态总数,n0是把变量间隔(0,x2)等分的等分数n2与变量间隔(0,x1)等分的等分数n1之差。n0=n2-n1。p0则是在任意一个足够小的变量等分上作为伯努利事件的指定事件出现的概率。

统计力学第三定理: 在无任何非自然约束条件下,任何存在A都在时间和空间等存在的形式上,与其对立面非A平等地合一:平等的A与非A以最大发生概率同时空发生。 以上现代统计力学和热力学新世代的统计力学第三定理之所以被称为定理,那是因为可以简明地给出这第三定理的数学证明。对于概率分布p1,p2,...,pn,上述发生概率P有确切定义:P = p1 * p2 *...* pn

统计力学三定理的推论:无任何非自然约束条件下,任何道法自然的存在“我”和“非我”都在时间和空间等存在的形式上自然彻底突破二元对立或两分性:(1)自然彻底突破二元对立或两分性的我执性。对于任何存在“我”和“非我”而言:“我”就是我;“非我”就是非我这个观点不再成立。“我”不是我(A);“非我”不是非我(非A);“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我(2)自然彻底突破二元对立或两分性的完全可分别性。“我”绝对不是非我(非A);“非我”绝对不是我(A)这个观点也不再成立。“我”与“非我”以最大发生概率及0.5和0.5这种均匀概率分布同时间同空间具有A与非A两种成份:处于叠加态0.5A + 0.5非A = 0.5我 + 0.5非我

参考文献

【2-1】田学全 李青,的方法,塔里木农垦大学学报,第14卷第3期,2002年9月。https://wenku.baidu.com/view/f84592324a7302768e9939f4.html

【2-2】冯向军,《关于决定性事件的概率论》的里程碑:发生概率和信息熵同时最大原理,科学网,2017年7月24日。http://blog.sciencenet.cn/blog-1968-1067848.html

【2-3】冯向军,发生概率和Tsallis广义熵同时最大原理,科学网,2017年7月24日。http://blog.sciencenet.cn/blog-1968-1067918.html

【2-4】Zipf定律,360百科,https://baike.so.com/doc5509828-5745574.html

【2-5】冯向军,关于平均概率的系统性研究,科学网,2017年6月12日。

http://blog.sciencenet.cn/blog-1968-1060381.html

【2-6】冯向军,n元现代科学阴符数(n-ary MSYFN ),科学网,2017年7月8日。http://blog.sciencenet.cn/blog-1968-1065135.html

【2-7】百度百科,幂律分布。https://baike.baidu.com/item/%E5%B9%82%E5%BE%8B%E5%88%86%E5%B8%83/4281937?fr=aladdin

【2-8】冯向军,冯向军一般化知觉模型及其对几乎所有的信息测度的统一,科学网,2017年6月30日。http://blog.sciencenet.cn/blog-1968-1063880.html

【2-9】Wikipedia,Tsallis distribution,https://en.wikipedia.org/wiki/Tsallis_distribution

【2-10】冯向军,基于概率的于宏义观控测度,科学网,2017年6月17日。http://blog.sciencenet.cn/blog-1968-1061285.html




https://blog.sciencenet.cn/blog-1968-1066676.html

上一篇:关于著书立《关于决定性事件的概率论》之说的正式声明
下一篇:分布探源:一个关于导致分布的约束条件的统一表达式
收藏 IP: 113.222.197.*| 热度|

1 李亚平

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 11:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部