||
<个体-标志值-集合>和它的复杂程度之七
掷一个骰子,它出现几点(那点向上)就有随机性,从一副麻将牌中随便取一张牌,它究竟是什么牌也有随机性。玩麻将牌者要拿13张牌,这13张牌就构成了一个个体集(群体)。显然在没有拿到牌之前,这付牌究竟是什么也有随机性。100位顾客买了那些东西,他们的花费各是多少?在 事先也有随机性。看来,某些个体集及其分布函数究竟是什么的随机性问题是值得研究的。而这也就引出了不同的个体集(如抓13张麻将牌)有不同的出现概率问题。现在我们设法把它量化和深化。
某人上班要经过10个红绿灯路口。针对每次上班可以问:你遇上了几次红绿灯。本问题的答案显然有随机性。从个体集语言的角度看,“经过10个有红绿灯的路口”等价一个个体集有10个个体,“红灯”、“绿灯”对应两种标志值。而回答了红灯(或者绿灯)的出现次数也就等价于知道了分布函数(不同颜色的灯各有多少)。如果遇到的红灯次数被概率计算出来了也就知道了不同的个体集(分布函数)的出现概率(机会)。
本问题是概率论中的二项分布问题。设红绿灯的出现概率都是0.5(相等),经过10次路口遇到m次红灯的概率p(m)为
p(m)={10!/[m!(10-m)!]}(0.5)10 (11)
---
表8第二行给出了不同的红绿灯次数m对应的不同的出现概率p(m),第三行是利用复杂程度公式(9)计算出来的对应的复杂程度值。
表8不同红绿灯的出现概率
(不同的个体集、分布函数、复杂程度的出现概率不同)
红灯次数m |
m=0 |
m=1 |
m=2 |
m=3 |
m=4 |
m=5 |
m=6 |
m=7 |
m=8 |
m=9 |
m=10 |
该事件出现的概率×1024 |
1 |
10 |
45 |
120 |
210 |
252 |
210 |
120 |
45 |
10 |
1 |
复杂程度(比特) |
0 |
4.6 |
7.2 |
8.8 |
9.7 |
10 |
9.7 |
8.8 |
7.2 |
4.6 |
0 |
表8说明:出现概率最高的个体集(事件)也是复杂程度最大的个体集(事件)。在概率的对数与复杂程度的坐标图(略)上它们是直线关系。
如果标志值不仅只是两个(红绿灯)而是k个可能值x1, x2,…,xi,…, xk、而它们的出现的概率p1, p2,…,pi,…, pk(也称为先验概率)可以彼此不相同、个体的总个数相当多(可以利用Stirling公式 lnN!=NlnN-N ),利用概率论中的多项式分布公式,可以得到下面的关系
lnP=C+∑nilnpi i=1,…,k(12)
ni是概率为pi的标志值占有的个体数量。
---
这个公式体现了不同的个体集的出现概率P与其复杂程度C的关系。它表示该个体集的出现概率的对数等于该个体集的复杂程度再加上“另外一项”。显然当概率达到最大值时,复杂程度与“另外一项”的合计值也达到最大值。概率最大的事情自然是在一次实验中最容易出现,所以最容易出现的个体集是复杂程度与“另外一项”的合计值最大的个体集。
“另外一项”在本例中包括了各个结局的出现概率,它对应着一种限制、约束条件。在另外的场合它的外型可能不同。但是它都包括着一些约束条件。考虑到有的个体集的出现还会附有其他的约束条件,我们把“另外一项”更含糊化为“在限制条件下”。于是上面的公式、红绿灯的例子、概率公理和以后的例子,我们把:
“有随机性的客观事物(个体集)都自动使自己内部状态的复杂程度在限制条件下达到最大值”称为最复杂原理。
最复杂原理的正确性体现于多次实践中它经常是对的,而不是每次必然正确,它与“正方形的面积等于边长的平方”之类的确定性规律在品格上是不同的。
你在街上会遇到很多人,有买东西的、上学的、做生意的、出差的、看病的等等。把遇到的人看成是一个个体集,根据最复杂原理这个个体集内的人(个体)的活动目标(标志值)会自动最复杂化。从商店出来的人都买了相同商品的事件的出现概率就非常小的,最容易出现的情况是买什么东西的人都有。所以最容易出现的也正是复杂程度最大的。你把一个玻璃杯摔碎了,碎玻璃的大小都相同?根据最复杂原理,它们是尽量地不相同,碎玻璃的大小尽量复杂化。仔细想想,符合最复杂原理的事物几乎是司空见惯。
最复杂原理不仅在生活的事例早已司空见惯,而且也可以推导出很多定量规律。利用分布函数可以计算该个体集的复杂程度。对此也可以反过来思考:对于有随机性的个体集,根据最复杂原理(复杂程度最大),能否反算出分布函数?
这个问题非常有吸引力。但是,在离散变量的情况要利用求函数的极值的技巧反求自变量(分布函数)。在连续变量的情况下就要利用变分技术去反算未知函数(连续型的分布函数)。“拉哥朗日乘子方法”经常帮助我们达到目标。现以“斩乱麻问题”为例说明之。
把长为L的绳子随机地切割成充分多的N段,问不同长度的线段各有多少。这就是斩乱麻问题[4]。把切碎的绳子看作是个体集,这就是利用随机性从理论推测其分布函数。
切割的随机性造成了线段长短不齐,它体现了事物的复杂性。以f(x)这个分布函数表示不同长度的线段占的百分比(权重),那么它对应的复杂程度为
C=-∫Nf(x)lnf(x)dx (13)
切割当然不是烧掉,切割后的线头总长度应当等于L,即
L=∫Nxf(x)dx (14)
根据最复杂原理,C应当在一定的约束条件下达到最大值。而上式是一个约束,另外百分比的合计值应当等于1,即
1=∫f(x)dx(15)
也是一个约束条件。
现在的问题是:在(14)、(15)的约束条件下使C最大的分布函数f(x) 应当是什么。根据求泛函数极值的拉哥朗日方法,构造一个新的函数F:
F=-∫f(x)lnf(x)dx +C1[∫xf(x)dx- L/N] +C2[∫f(x)dx- 1] (16)
--
这里的C2,C2是待定常数。很显然,复杂程度C达到最大值,F也达到了最大值。在F达到最大值(体现最复杂原理,也考虑了本问题的特殊约束条件)时它对未知函数f(x)的变分应当等于0。利用F对f的变分为0,我们得到
f(x)=exp(-1+C1x+ C2)。
--
利用(14)和(15)消去未知数C2,C2解得
f(x)=(N/L)exp(-Nx/L)
注意到L/N的含义是线头的平均长度,以a表示它(也是常数),有
f(x)=(1/a)exp[-(x/a)] (17)
它是一个负指数函数。即一堆斩乱麻中,不同长度的线头占的百分比(分布函数),应当是负指数函数(相对密度分布函数)。它显示长度x短(小)的线头多而长线头很少。
根据相对密度分布函数的定义,线头长度在x→x+Δx 范围的有Nf(x)Δx 段。如L=
我们可以做一个数值模拟实验以得到一个斩乱麻的样本。对比显示最复杂原理得到的理论分布与模拟实验结果的一致的。这说明最复杂原理与实际相符合。例子中虽然利用了复杂程度最大,但是没有计算复杂程度的最大值究竟是多少。原因是我们主要兴趣是利用复杂程度最大去推算理论的分布函数。
一般地说,只要某个体集具有随机性,就可以利用最复杂原理配合不同的约束条件得到不同的理论分布函数。客观存在的有随机性的个体集很多,所以利用最复杂原理求分布函数的一般方法有广泛的应用和价值。
我们从不同的“个体-标志着-集合”的出现概率入手,利用了概率最大对应复杂程度最大,从而得到了复杂程度最大的个体集也就是出现概率高的个体集。我们把它称为最复杂原理。由于已经说明热力学熵是复杂程度的特例,所以联系着热力学熵的热力学第二定律(熵原理,熵最大原理)也是最复杂原理的特例。
复杂程度是物质自身天然具有的属性,它和质量、能量一样地真实。关于物质的质量、物质的能量已经有了质量守恒、能量守恒定律,与之对应也应当存在一个关于物质的复杂程度的变化规律,现在暂称为“复杂度定律”。限于篇幅这里仅指出某些观点:
l 个体集概念有层次性,复杂程度也具有层次性。不同层次(形态)的复杂程度都客观存在。这类似物质的能量有化学能和核能。不同形态的能量可以互相转化,不同层次(形态)的复杂程度也可以互相转化。
l 有限的物质仅具有有限的质量和能量,它也仅具有有限的复杂程度。“物质可以无限分隔”的观点等价于有限物质的复杂程度为无穷大,这个观点使复杂程度概念失去物质性,所以它是错误的。
l 建议把目前流行的世界的三元观(物质+能量+信息)修改为物质属性的三元观(质量+能量+复杂程度)。
l 存在着质量变换机构(如木器厂)、能量变换机构(如水利发电厂)和信息变换机构(如电视机),但是使输出的质量、能量、信息大于出入的变换机构是不存在的。
l 爱因斯坦的质量能量公式可能要扩大为质量、能量、复杂程度之间的定量互相转化关系,而其总量具有保守性。写为公式就是,对于孤立系统,有
Δm+ΔE/v2+kΔC=0 (18)
这里的v是光速、C是复杂程度、m,E分别是质量和能量。而k是待定常数。
l 我们暂且把上面的认识连同最复杂原理合称为复杂度定律。
根据个体集(客观事物)的分布函数,利用公式(9)可以计算该广义集合的内部状态的复杂程度。具有随机性的广义集合,它的复杂程度常常是在一定约束条件下的最大值。利用这个最复杂原理可以推导很多事物(个体集)的理论分布函数。
复杂程度是客观物质具有的基本物理量,它与质量、能量一样的真实,在一定的意义下它与信息熵成正比例。关于客观事物的复杂程度的一般规律与最复杂原理一并称为“复杂度定律”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 21:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社