|||
从数学的角度,“概率”有明确、抽象的定义,我们不去讨论。从现实的角度,在大部分的概率论科普文章或学者的意识中,概率是对随机事件发生的可能性大小的度量。然而,真的是这样吗?
瑞士语言学家索绪尔认为任何一个概念的内涵和外延都会随着历史的发展而发生变化。人类的语言是不精确的,我们司空见惯,认为大家都存在共识的词语只是对事物某方面属性的归纳,甚至也许是错误的歪曲。例如“灵魂”这个词,现代科学的发展,让我们知道,这个词语所指的事物,其实根本不存在。
概率论作为一门学科,它是真实的存在,但是关于概率的现实定义,我们必须要明确几个问题。
随机事件可以度量或者说判断吗?
在大家的共识中,随机事件指的是可能发生,也可能不发生的事件,最常用的例子就是扔骰子。骰子是一个正立方体,有6个面,我们分别用数字1-6代表,作为一种赌博用具,人们希望找到一种扔骰子之后,事前判断具体哪个面朝上的方法。那么,事前判断的方法是否存在?
这种方法存在,同时也不存在。
当我们只扔一次骰子时,事前判断哪个面朝上的方法是不存在的。这一点必须要强调,因为这不仅是事实的归纳,同时也是逻辑的推理结果。如果事前判断方法存在的话,所谓随机事件这个概念就是空谈了。更进一步说,这个世界就只能成为事前决定好的,不会出现任何变化了。
如果我们扔很多次骰子时,事前判断某个面朝上出现次数的方法是存在的。1713年,瑞士数学家伯努利就总结出一条规律:在试验不变的条件下,重复试验多次,随机事件的频率无限趋近于某一固定数值,人们将其称为“伯努利大数定律”。从伯努利开始,人们逐渐发展了概率论这个数学体系。
对随机事件进行度量和事前进行判断,二者是一回事。
所谓度量指的是给予事物一个度量尺度,或者指定一些符号加以区分。例如一个事件发生,我们记为1,没有发生,我们记为0。判断指的是对事物的某个属性进行确定,而确定后的结果就是能够把事物和其它事物区分开来,例如说,我们扔一个骰子后判断,数字3的那一面朝上。
当一个事件已经发生之后,我们可以对这个事前的属性进行判断,但这个事件已经不是什么随机事件,而是事实了。例如扔一个骰子,结果为3,对于这个事实,我们可以度量,但是这并不是对随机事件的度量,只有在事件还没有发生之前,它才是随机事件。
当事件尚未发生时,我们就对其结果进行判断,加以区分,并将其称为度量,这样的方法怎么可能会存在?
可以肯定的是,对于唯一的随机事件,所有宣称能在事前对结果进行判断的都是骗子,没有一个理性的人会声明在事前就能计算出随机事件的结果。所有试图在事前对唯一的随机事件结果进行判断的赌徒最后在现实面前都伤痕累累。
因此当我们询问随机事件是否可以度量时,我们必须要清楚,随机事件是1次(唯一的,下文称唯一的随机事件),还是反复进行多次?我们可以将随机事件的发生作为一个集合,如果这个集合中只包含一个元素,我们必须要强调,随机事件无法度量。
然而很多人,甚至包括熟悉概率理论的学者,却忽略了这个基本事实;从传统思维出发,他们认为无物不可度量,并且使用大众所熟悉的符号-例如数值、熟悉的概念-如概率,试图对唯一的随机事件进行度量。他们不明白的是,能够给出度量尺度,和真正能够度量是两码事。
当我们拿一把尺子去度量长度,给出数值时,尽管会与真实的事物长度存在误差,但给出的数值和真实的长度是紧密相关的,我们称二者非独立的。而我们用数值(例如概率数值)去度量唯一的随机事件时,我们给出的结果和事件发生后的状态,二者没有任何关系,用数学语言来说,二者是独立的。在这种情况下,我们怎么能将其称为度量呢?
随机事件的可能性指的是什么?
如果说概念存在模糊性和不精确性,恐怕没有比“可能”更模糊和不精确的了,因为它就是描述事件模糊性和不精确性的概念。我们使用语言的时候,由于词语的模糊和不精确,我们想要表达的意思不一定能被准确的描述出来。按照索绪尔的观点,我们必须要了解大众在使用“可能”这个词语时,他们所想要表达的想法究竟是什么?
例如说,明天可能下雨,也可能不下雨,下雨的可能性比较大。
当我们说出这句话的时候,我们要表达的想法可以这样描述:
1. 明天是否下雨是一个随机事件,该事件的所有结果可以形成一个集合,记做{下雨,不下雨},我们将这个集合称为样本空间,里面的元素称为样本点,2个样本点分别是下雨和不下雨,除此之外,没有第3个元素。
2. 随机事件-明天是否下雨的结果只有在事件发生后才能描述,事件发生前我们无法判断,因此才将其称为“可能”。
3. 虽然我们无法判断该随机事件发生后的结果,但根据以往经验判断(以往经验指的是对该随机事件反复进行多次,或称为多次试验),在类似的条件下(试验条件不变的情况下),下雨的频率(频率指的是下雨的次数/试验的总次数)无限趋近于固定的数值,该数值大于50%。
4. 虽然我们知道了下雨的频率,并且可以根据该频率对随机事件“明天是否下雨”给出一个数值做判断,但我们的主观判断和随机事件“明天是否下雨”的结果其实没有任何关系,2者是独立的。
通过以上的描述我们可以看出,当我们说“可能性”的时候,至少有2种含义:1是表达样本空间中样本点数量的多少,例如明天是否下雨有2种可能性;2是表达多重试验的频率,例如我所居住的海口,在1-2月份,经常会出现阴雨连绵的天气,下雨频率较高。而绝非真的对明天是否下雨进行了事前判断,即使其主观真的是在做事前判断,这种判断也和随机事件的真实结果独立。
概率不是对随机事件发生的可能性大小的度量。
“可能性”这个词语是模糊而不精确的,在大众语境下,可能性大多是指对样本空间中样本点的数量进行描述。在这种情况下,可能性不是大小的问题,而是多少的问题,虽然我们勉强可以用可能性大小来描述。例如:随机事件-扔1次骰子,事件的样本空间有6个样本点,用集合表示为{1,2,3,4,5,6};随机事件-明天是否下雨,样本空间有2个样本点,用集合表示为{下雨,不下雨},所以扔1次骰子结果的样本点数量比明天是否下雨的样本点数量要多。很明显,这种对样本点数量的比较并不是概率。
那么我们将可能性大小作为多重试验的频率来理解,不就是概率了吗?
然而,大众语境真的是这么理解的吗?
当我们定义“随机事件发生的结果”时,大众语境是将其理解为多次重复试验后,某样本点发生的频率,还是将其理解为唯一随机事件发生的结果呢?
很明显,大部分人认为是唯一随机事件发生的结果,甚至我们所举出的例子都是“明天是否下雨”这样的唯一随机事件,而不是例如“今后10内,下雨6次”这样的多次重复试验,而且即使是多次重复试验,在事前我们也是将其作为唯一随机事件来看待的。
在这种情况下,随机事件可以度量吗?我们前面已经说明,这种随机事件根本不能度量。
概率的数学定义是抽象的,不容易被人们理解。“概率就是对随机事件发生可能性的度量”这个定义,非常容易理解。但词语“可能性”模糊而不精确,用它来说明概率,不仅是错误的,而且隐藏了一个假象,即大众会认为,唯一的随机事件是可以度量的,我们可以给随机事件一个数值来判断其是否发生。这种想法与概率论要表达的理念可以说是背道而驰。
从现实角度,概率到底是什么?
如果概率不是对随机事件发生可能性的度量,我们该如何来定义概率呢?目前看起来,除了柯尔莫哥洛夫(1933)提出的概率数学定义之外,恐怕哪种定义方法都是存在问题的。
在柯尔莫哥洛夫之前,米泽斯将概率定义为随机事件发生频率的极限,我们称为概率的频率定义。诚然,频率定义是有缺陷的,频率学派和贝叶斯学派为此争论了几十年,但是这个定义反映了人们对概率的认知过程,也表达了概率论的基本理念。
第二种方法就是将概率定义为随机事件不确定性程度的度量。这种方式强调了随机事件的随机性,符合概率理论的基本理念。但不确定性的度量尺度却和概率的数值方向完全相反,而且也和信息量的度量彼此有重合,解释起来恐怕又是一番口舌。
从方法论上,概率反映了主观与客观世界的统一。人们对客观世界不确定性的认识是一个长期的过程,在这个过程的截面时间点,我们可以提出一个数值,或者一个变量来总结和描述以往事件演化的历史。进一步来说,人们所说的概率绝对不是对随机事件是否发生可能性的判断,而是对类似事件以往发生的经验总结,人们在这个经验总结的基础上制定应对的策略。如果没有对以往类似事件的总结和描述,所谓的概率数值毫无意义。
换句话说,关于明天是否下雨,我们并非能真的提前预测,而是试图对会发生的结果给出不同的对策。在这种情况下,我们给出一个数值,并将这个数值称为概率,如果这个数值不是对以往类似条件下,下雨情况的总结和描述,那么这个数值将毫无意义。
那么下一个问题就是:我们真的能将一个过程用一个概念描述出来吗?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 07:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社