|||
1. 破碎问题:
l 有一条长10米的线,用刀任意的切割成为N段;问,不同长度的线头各有多少?
l 有个茶鸡蛋,蛋壳上有很多裂纹,从而形成了很多小面积;问,不同的小面积各有多少?
l 有一块1平方米的玻璃被摔碎了;问,不同面积的玻璃各有的百分比可能是多少?
l 喷壶里装着水,用力推喷壶活塞,药水就喷出很多小水滴;问,不同大小的水滴各有多少?
l 有1立方公里的水被某天气系统从空中任性地洒向1万平方公里的地面;问,获得不同降水量的面积各有多少?
l 100年中某地共下了H毫米的雨,它是分为1万次降水过程而落地的;问,不同降水量的降水过程各有多少?
l 100年中某地有1万次降水过程,它们共占用了10万小时;问,不同降水过程经历的时间各有多少?
以上这些看似不同的问题具有一定类似性。不妨把它们统称为“破碎问题”。它们在结构上大致有两个共同点:一是总量具有确定性(线绳的长度、气候不变,则总降水量也不变等等),另外一个特点就是具体每个过程的结局具有随机性。这里探讨这类破碎问题中的比较简单的一类,斩乱麻模型就是对它们的概括。
2. 斩乱麻模型的数值实验
设想有一段长度为L的线被任意地切割为很多段(类似斩乱麻)。于是获得一堆长短不齐的碎线头。现在问,不同长度的线头各有多少。具体做这个物理实验固然可以,但在电脑上进行对应的“数值实验”更方便。例如,打开一个空白的excel的工作簿,然后取0-10000之间的9999个随机数,就可以把长度为10000的线切成为1万段。然后统计不同长度的线段占的数量,这已经是答案了。表#.a就是一个类似的实验结果。这个结果对应于线头长度的合计值(总长度)为10000,于是各个线头长度的平均值等于1。
表#.a 斩乱麻实验的一个实验结局
线头长度 x |
出现次数 y |
次数的自然对数z |
0-0.5 |
3954 |
8.282483 |
0.5-1 |
2369 |
7.770223 |
1-1.5 |
1418 |
7.257003 |
1.5-2 |
877 |
6.776507 |
2-2.5 |
559 |
6.326149 |
2.5-3 |
321 |
5.771441 |
3-3.5 |
213 |
5.361292 |
3.5-4 |
123 |
4.812184 |
4-4.5 |
67 |
4.204693 |
4.5-5 |
34 |
3.526361 |
5-5.5 |
21 |
3.044522 |
5.5-6 |
16 |
2.772589 |
6-6.5 |
11 |
2.397895 |
6.5-7 |
4 |
1.386294 |
7-7.5 |
7 |
1.94591 |
7.5-8 |
2 |
0.693147 |
8-8.5 |
1 |
0 |
8.5-9 |
1 |
0 |
9-9.5 |
2 |
0.693147 |
合计 |
10000 |
- |
以线头长度与出现次数做直角坐标图,就看到随着线头长度增加,出现次数迅速减少的图#.a。
图#.a斩乱麻实验的线头长度与出现次数的关系
(图请打开WORD版文稿)
3. 斩乱麻模型的理论分析
以上的数值实验可以进行多次,而每次获得的曲线的基本特征几乎是相同的。这个曲线实际对应着一个概率密度分布函数。而概率密度分布函数的一种积分对应着一个统计熵(信息论的熵)。做多次试验,就可以获得多个略有不同的概率分布函数,也就获得多个熵的值。但是在随机性很大的这些统计实验中,熵最大的结局是最容易出现的。于是我们就可以反过来考虑:在约束条件仅为一个总量不变的情况下,熵最大所对应的概率密度分布函数是什么?其答案是这个函数应当是负指数分布[[1],[2]]。按照这个基于最大熵原理的分析。如果作为唯一的不变量的物理意义是代数平均值a(或者合计值,它们是等价的),而具体各个线头长度变量的值以最任意的方式出现,那么不同变量值的概率密度分布函数就是如下形式的负指数分布:
f(x)=(1/a)exp(-x/a) (#.a)
这个负指数函数的形状与图#.a是十分一致的。这里的变量x仅能取正值(线头的长度不能小于零),而且变量取值小的情况出现的概率高,随着变量值加大,出现概率迅速减小。为了更直观地看到理论结果与实验结果的一致性,我们把公式(#.a)两边取自然对数,而有
ln f(x)=ln(1/a)- x/a (#.b)
于是我们看到出现概率的对数与变量是直线关系。在图#.b上给出了斩乱麻实验中获得的不同线头长度x与出现次数y的自然对数z的关系,它们体现为一条直线。注意到出现次数与总次数10000的比值对应于理论上的概率,这与理论分析是一致的。
图#.b斩乱麻实验的不同线头长度与出现次数的自然对数的关系
现在进一步分析理论公式与实验获得的经验公式的一致性。在理论公式#.b 中f(x)表示变量x出现于x±0.5的概率。而我们的数值实验中获得的出现次数,则仅是变量在0.5间隔中的对应值。所以出现次数的值乘以2,才是与概率对应的在10000次试验中的出现次数。令y为0.5间隔中对应的实际出现次数(即图#.a的纵坐标),则
f(x)=2y/10000=y/5000
令lny=z,有z=ln f(x) +ln5000,注意到本数值试验中a=1,于是公式#.b变成了
z=ln5000-x
z=8.517-x (#.c)
即从理论上讲,做随机性切割1万段时不同长度x的出现次数y的对数z与x是直线关系是公式(#.c)。另外,在数值试验中excel软件帮助我们获得了图#.b,也获得一个拟合实际数据的经验公式,它是
z=8.512-0.9259x (#.d)
显然公式(#.c)与(#.d)的外形是相同的,都是直线关系,它们的常数项仅在第4位上有0.005的出入,另外就是变量前面的系数,理论值=1,而实验值=0.9259.这个差别达到了7%。略大了一些。但是从总体上看理论对应的是最理想的情况,而随机性实验则是围绕理论结果而必然有一些出入。
这样我们就看到斩乱麻模型的实验数据与理论结论的一致性。它告诉我们:
在一个“破碎问题”里面,如果仅存在一定不变量(总量不变,代数平均值不变)而各个破碎的单元(线头长度等)的形成具有任意性,那么不同大小的破碎单元的出现数量与其大小服从负指数函数关系。
在气象学中,我们持有各地的气候量(如多年平均的降水量等等)基本是不变量的观点在一级近似意义下是符合实际的。这种观点也使我们认为天气过程是形成气候的具有随机性的过程。于是推断一下天气过程的统计特征服从负指数分布是合理的猜想。自然这个猜想是否符合实验,需要用气象数据做验证。
如果验证的结果是很多地方,对应的天气统计特征确实符合负指数分布(不同地点负指数分布中的参数可以不同),我们就比较相信这种规律具有普遍意义,即普适性。
附带指出这里的斩乱麻模型与统计物理学中理想气体的分子动能服从负指数分布是一致的。那里的这种分布函数经常被称为波尔兹曼分布。波尔兹曼分布也是总能量限度情况下,能量如何分布在各个分子动能中的例子,它也是破碎问题的一个例子。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 20:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社