|
概率的定义及其本质
曾纪晴
今天读到黄河宁老师推荐的谢钢教授的博文《统计学界至今无法在概率的定义这个基本问题上达成共识》,感到非常震惊。我以为量子物理学家们对概率的理解有问题,没有想到数学家们对概率的定义也没有达成共识。
谢钢教授认为,尽管概率论的数学理论基础(probability calculus)早在1950年代就以柯尔莫哥洛夫(A.N. Kolmogorov, 1903-1987)为主的理论统计学家们建立和完善了,但是如何从现实生活人们能感知描述理解的角度来定义概率却成了一个统计学家和科学哲学家们至今无法达成共识的难题。也就是说,人们对概率的实际物理意义,概率的本质含义,还缺乏深刻的认识。
谢钢教授引用了David Salsburg在他的“The Lady Tasting Tea”一书中的疑问:“柯尔莫哥洛夫建立了概率的数学定义:概率是一个抽象空间里对一事件集合的一种测量。所有概率的数学特征都可由这个定义导出。当我们希望在现实中使用概率时,我们需要确定眼前特定问题事件的抽象空间。当气象播音员说明天降雨的概率为 95%时,什么是所测量的抽象事件的集合?是指明天要外出的所有的人吗?其中有 95%的人会淋雨?还是指可能逗留在外面的时间?其中有 95%的时间我会淋雨?或是说在一个 1平方英寸大的地方,有 95%的面积会下雨?当然这些解释都不对,那么到底是什么意思呢?”这个质疑是非常有力的,说明柯尔莫哥洛夫建立的概率数学定义并不能很容易地应用于现实领域。如果不同的人对于概率有不同的理解,这样就表明人们对概率的本质含义并没有真正理解。
为什么人们认为柯尔莫哥洛夫建立的概率定义没有问题,但面对现实生活中的各种应用领域却对概率存在许多理解上的问题呢?我查了一下柯尔莫哥洛夫的所谓“概率定义”,发现这个所谓“定义”并非真正的概念定义,而只是把概率用集合论的形式来研究其性质。其所谓“公理化定义”是这样的:
设E是随机试验,S是它的样本空间。对于E的每一事件A赋于一个实数,记为P(A),称为事件A的概率。这里P(A)是一个集合函数,P(A)要满足下列条件:
(1)非负性:对于每一个事件A,有P(A)≥0;
(2)规范性:对于必然事件,有P(Ω)=1;
(3)可列可加性:设A1,A2……是两两互不相容的事件,即对于i≠j,Ai∩Aj=φ,(i,j=1,2……),则有P(A1∪A2∪……)=P(A1)+P(A2)+……
在这个所谓“公理化定义”中,完全没有对概率概念的内涵作出解释。可见,这个所谓概率的公理化定义实际上并不是对概率的真正定义,因此人们在实际应用中就必然面临着对概率不同解释的问题。
目前,对概率的理解或解释主要有如下四种:
(一)个人信念度解释或主观解释:认为概率是对个人信念合理性的量度。比如赌博,每个赌徒对事件发生的可能性有不同的猜测,得出不同的概率,因此也叫主观概率。
(二)确认度解释或把握度解释:根据对某事件发生的规律性认识,对大量观测数据进行建模分析,然后预测未来某事件发生的可能性。比如,通过对气象数据的建模分析,得出明天下雨的概率为85%,就是说预报员有85%的把握认为明天会下雨。
(三)频率解释或频度解释:独立重复试验总次数n,事件A发生的频数m,事件A发生的频率Fn(A)=m/n,随着n的增加,A的频率Fn(A)趋于一个稳定值p时,就称频率p为事件A发生的概率,记作P(A)=p。
(四)倾向度(propensity)解释:指的是形成一个事件的相关系统的内在固有的设计或特性所决定的促使该事件发生的“倾向性”。比如,抛掷一枚正常的硬币得到正面的概率是0.5因为该硬币的物理构造决定了它的正反面的对称性形成的“倾向性”;类似的,抛掷一枚正六面体的色子,其某一面朝上的概率是六分之一因为其物理构造的六面对称性所带来的事件发生的“倾向性”。
倾向度的概率解释最早在1930年代就由科学哲学家Karl Popper提出,并于1950年进一步改进。科学哲学家Mario Bunge认为,倾向度的概率解释应该被确认为正确的现实生活意义上的概率概念的定义。在Mario Bunge看来,频率解释虽然不能作为概率定义来理解,的确可以在实际统计数据分析时用来近似估算概率的大小,“个人信念度”的概率定义则是一无是处的。
目前,对概率的解释或定义尚没有达成一致,人们根据自己的理解为概率下定义,这就造成了许多混乱和困惑。当赌徒说这一把赢的概率有8成时,当天气预报员说明天下雨的概率是85%时,他们的概率概念与统计意义上的概率概念(概率频率解释)是不同的,也与倾向度定义概率概念完全不同。目前,在教科书中采用的概率定义一般都是频率解释。而早在1930年就提出的倾向度解释定义则很少受到关注,谢钢教授对于统计学家们对此作壁上观表示难以理解。
我发现,人们很容易混淆“不确定性”与“概率”。概率的“个人信念度解释(主观解释)”和“确认度解释(把握度解释)”就是混淆个人主观上对于判断某事件发生的“不确定性”与某事件客观发生的概率。实际上,无论是按照概率的统计学定义(频率解释)还是倾向度定义,某事件发生的概率的大小都是确定的、可计算的。比如当你抛掷骰子时,骰子每个面朝上的概率就已经注定是1/6,不会因为不同的人抛掷而概率有所改变。所谓的不确定性,仅仅是每次抛掷时你不知道(不能确定)它一定是哪个面朝上。因此不确定性是主观的,是相对于人的认知来说的,而概率则是客观的,是确定的,两者不能混淆。
当我们抛掷骰子时,如果每次抛掷的力度、角度、方向、速度等等都完全一致,那么骰子每次落在桌面上时都会是同一数字朝上,因为这是一个完全可重复的过程。但实际上,我们每次抛掷骰子的力度、角度、方向、速度等等都是不可控的,都是任意变化的,这就造成了均匀的随机性。由于存在随机性的因素,每次抛掷的结果就具有“不确定性”。可见,每次抛掷结果的不确定性,只不过是随机性的表现。
当我们分析硬币和骰子的结构时,发现它们都是均匀的空间分布结构。在随机性抛掷的情况下,硬币或骰子均匀的空间结构,就决定了硬币正反面朝上的概率都是1/2,骰子每个面朝上的概率都是1/6。因此,在随机性试验的前提下,结构的均匀性决定了概率的均等性。假设骰子的结构不均匀,比如为非正六面体,每个面大小性状不同,或者组成骰子的物质密度不均匀等等,那么虽然是随机抛掷,每个面朝上的概率就不均等了。因此,结构的不均匀决定了概率的不均等。这也是概率的倾向度解释的基本含义。一般地,物质的结构或系统的结构,决定了事件发生的“概率”。我们通过对不同物质或系统之间的相互作用表现进行多次观测,就能得出一个频率值,通过这个频率值就能够间接地推测出物质结构或系统结构内部的奥秘,即找寻真正的科学规律。这应该就是概率的本质含义。
对概率的概念有了正确的认识之后,我们回过头来对照一下量子物理学家们的说法。海森堡测不准原理本来是说由于测量行为会干扰被测量的微观粒子,从而使得其位置或动量发生改变,以至于难以同时准确测量位置与动量两个指标。但后来,量子物理学家们把这个测不准原理改称为“不确定性原理”,后来他们就认为微观粒子本身具有不确定性,微观粒子是基于概率的存在。用他们的语言来说,微观粒子本身就是各种不确定性状态的叠加态。他们认为,微观粒子能够同时处于不同的位置,同时处于多个不同的状态,甚至同时处于相反的状态,比如同时左旋和右旋。首先,他们的错误是把测量引起的扰动带来的干扰性误差当做了微观粒子本身的不确定性。前面我们已经分析,抛掷(试验)骰子结果的不确定性时由于抛掷(试验)的随机性造成。微观粒子状态的不确定性是什么试验造成的结果?如果是它本身的状态,没有对它进行任何试验(比如抛掷之类的操作),怎么会出现不确定的状态呢?如果没有对它进行随机性的试验,那就不存在所谓不确定性的结果。因此,说微观粒子本身具有不确定性,是不符合逻辑的。任何一个自在存在的物体,都是一个确定性的存在。当你对其进行试验(比如测量操作)后,才会改变其原有的状态。如果说,对微观粒子状态的测量导致其状态的改变,也是测量行为导致了微观粒子状态的不确定性,而也不能说是微观粒子本身具有不确定性。其次,量子物理学家们错误地混淆了物质结构与物理状态。比如硬币的确可以正反面同时集于一身,骰子的确可以不同的面集于一身,但集于一身的是物理结构,不是物理状态!但他们却把多个不同的物理状态,甚至不可能同时出现的物理状态集于同一个粒子身上,并将其称为叠加态,比如同时左旋和右旋、既死又活。显然,他们是把硬币和骰子不同几何结构面这类物理结构与微观粒子的不同物理状态混为一谈了。可见,微观粒子叠加态这个说法是对硬币正反两面集于一身或骰子6个不同面集于一身的滥用。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 18:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社