|||
(1)
一般人谈概率,往往从卡尔达诺的工作谈起-作为一个赌徒,他当然讨论的是扔骰子。但是,早于卡尔达诺,在法庭的证物的证明中,已经对证物的可靠程度,有了判别,比如有的证物,我们就认为完全可靠,有的,则是真假不定,有的,则是完全不靠谱。虽然那个时候,还没有“可能性”多大的精准定量描述,但是,证物的分级已经存在。显然,对于这些证物的可靠程度,人们已经有了一个粗略的内心估计,虽然这个估计每个人并不相同。(https://en.wikipedia.org/wiki/History_of_probability#cite_note-3)
(2)
卡尔达诺(https://en.wikipedia.org/wiki/Gerolamo_Cardano)估计是最早精确定量估计“可能性”的人,在其《大术》一书中,他举了扔三个骰子的例子。他列举了扔三个骰子的各种可能结果,并且假定这些结果的出现可能性一致,然后通过计算能够获胜的可能性与其它可能性的比,来确定胜率。(https://en.wikipedia.org/wiki/History_of_probability#cite_note-6)
卡尔达诺的计算,隐含了一个前提,就是骰子质地均匀,结果每个面落地的可能性一样。这个前提成立吗?比如我们知道了袁贤讯给骰子某一面搞了很薄的水玻璃,结果使那一面落地的可能性增加,这个前提自然就不成立了。
这个“质地均匀”的假设,是经典概率得以定义的基础。(https://en.wikipedia.org/wiki/Classical_definition_of_probability)
假如骰子确实被袁贤讯弄了水玻璃,而我又不知道,但是我确实怀疑袁贤讯做了手脚,我该怎么办呢?
ok,我就拿着这个骰子来回扔,成千上万次的扔。假设我成千上万次的扔也不会磨坏那层水玻璃,那么我就可以负责任地说,如果那个面着地的频率大于1/6,骰子已经不均匀了,这就肯定了袁贤讯搞了鬼,虽然我不知道他涂了层水玻璃。
这是概率是一个来自频率派的定义,是指统计过程中,某种事件出现的频率。(https://en.wikipedia.org/wiki/Frequentist_probability)
频率派(至少在思想上)要求进行一系列相互完全独立的实验条件一模一样的相同实验,而当这个实验进行的次数趋无穷大时,某种事件出现的频率,就是此事件的概率。
(3)
我们很容易想象,并不是每件事发生的频率都可以类似成千上万次扔骰子的方式来判别。
当然,理论上,我们可以假定频率派的要求成立,然后分析相关结果。比如概率论诞生过程中,就有一个著名的例子-分赌本问题(http://www.92to.com/wenhua/2016/04-21/3520253.html):1654年,职业赌徒德·梅累向法国数学家帕斯卡(B.Pascal,1623-1662)提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局。他们约定,谁先赢三局则得到全部100法郎的赌本。当甲赢了两局,乙赢了一局时,因故要中止赌博。现问这100法郎如何分才算公平?
这个问题,非常有趣。答案的做法,已经涉及了条件概率的起源问题。当然,这个问题在成熟的概率论体系中是个简单问题,已经早就被解决了,读者可以查书。
我这里强调的是,虽然赌博没有进行完,频率派的办法也可以通过思想实验来分析和解决实际问题。(这个题目在经典概率框架下,就可以理解,我这里是为了强调频率派办法的实际可行性。)
(4)
我们追问自己的内心,我们真的是按频率论者的方式来分析和解决问题的吗?或者说我们一直都是按照这个方式来分析和解决问题的吗?
比如,开篇提到的法庭证据的可靠程度分级的问题,我们有办法给出如频率派般的解答吗?先不说相同的证据的在不同的案例出现情况都不一样,有时就是要求相近情况大量出现,都不容易做到。
(5)
贝叶斯派(https://en.wikipedia.org/wiki/Bayesian_probability)面对的问题,类似法庭证据可靠程度的问题。
整个贝叶斯派概率的概念的一般化描述,来自拉普拉斯。虽然拉普拉斯的定义是从古典概率开始的,但是纵观他提出的七原则,就会发现,他的这个“概率”,虽然也是用probability或者chance这样的词,但它所指的是人们根据经验、信念和掌握的信息而对事件的性质推断的把握程度的描述。很明显,这跟我要鉴定袁贤讯是否将骰子抹了水玻璃完全不同。
拉普拉斯提出的第一个原则是:在没有掌握任何信息前,所有可能的结果出现将是等可能的,如果有N个可能的结果,那么我们最先的推断则是出现某种可能的结果是1/N。这个原则称为“无差别原则”(https://en.wikipedia.org/wiki/Principle_of_indifference)。
然后根据信念、实验或者观察而得到得到的信息,我们会进一步对事情进行判断,并修正相应结果。
这个过程反复进行,相应的结果将不断被修正,最后这个结果会趋于一个相对稳定值,这个稳定值,才和频率派的“概率”相重合。-实际上,就结果而言,这两个学派的最终结果都是一样的。但是,除非有足够的前提推断,频率派是无法对单次事件做出概率估计的,但是贝叶斯派的概率则可以-虽然这种估计不一定准确,可在已有的信息基础上,针对未知,继续使用拉普拉斯的无差别原则每一次都使我们向真实的结果逼近了一步。
值得注意的是,只有在贝叶斯派概率的语境下,先验概率和后验概率的概念才如此重要,它们分别是只进行某种论断、实验、观察前、后对事件发生概率的判断。
人们往往将条件概率和贝叶斯公式与贝叶斯派的概率思想混同起来,以至产生各种误解。我想,这仅仅是因为,这些概率及其运算,都可以用相同的概率论公式计算的缘故吧。实际上,贝叶斯主观派创始人之一R.T. Cox(https://en.wikipedia.org/wiki/Richard_Threlkeld_Cox),就明确区分了相关概念。(https://en.wikipedia.org/wiki/Cox%27s_theorem)有兴趣的读者可以参考相关链接。
【要注意的是,贝叶斯派的思想并不一定来自贝叶斯(https://en.wikipedia.org/wiki/Thomas_Bayes
)本人。根据他的遗作《An Essay towards Solving a Problem in the Doctrine of Chances》,其作品的是为解决棣莫佛的教材《the Doctrine of Chances》中的一个问题而作的。(https://en.wikipedia.org/wiki/An_Essay_towards_solving_a_Problem_in_the_Doctrine_of_Chances)在其作品的Prog3,4,5中通过条件概率来解决了“逆概率”的问题,这个工作是为解决伯努利的随机试验的相关问题做准备的,这个结果现在我们称为贝叶斯公式。他的朋友Rechard Price(https://en.wikipedia.org/wiki/Richard_Price)在整理遗作后,写信给皇家科学院,认为贝叶斯公式是贝叶斯独立创造了的新东西。而就其遗作而言,贝叶斯本人更像是个现代意义上的频率派,而不是贝叶斯派,因为伯努利随机试验,是一个典型的设计好了的各次实验相互独立的实验,其按条件概率推算的结果,即Beta分布,是典型的针对伯努利随机试验的推算。】
(6)
现在,我们回到大家讨论了一个多月的王宏得病与否的问题。医生的处理手法,涉及假设检验和代价函数相关问题,牵涉频率派主导的数理学派关于假设检验的一系列技术,比较复杂。所以我们留待下回分解。
而黄秀清问:王宏得病关全世界人毛关系?这里我们就来说说毛关系。
王宏得病的真实概率,牵涉到王宏的性别,年龄,生理状况,生活习惯等等问题,从频率派的立场,我们是不会回答这样的问题的。而谈到检测,对于频率派来说,在大量医疗案例的事实的基础上,我们假定王宏是个平均意义上的个体,是可以通过统计近似得出p(王宏有病|王宏检测为阳性)和p(王宏检测为阳性|王宏有病)的条件概率的,而这也是医疗机构一般意义下,允许使用此仪器的前提。所以,我和高山一样,会认为这道题目不靠谱。
但是,对于贝叶斯派而言,他们就会使用基础概率,即人群患病率,来作为王宏得病的先验概率,在没有其他信息获得的情况下,开始分析王宏检验为阳性而其得病的条件概率。由于这个先验概率,是个推断,因此其推出的条件概率结果也不一定对。也就是说,黄秀清虽然没搞清基本概念,但是其提的问题则正指贝叶斯派的核心。
作为学者,你可以说,这是一个一系列行为开始的第一步;而要是你是一个医生,你可不敢乱说。
至于应行仁老师说,居然有医疗机构,将按照贝叶斯派算出的条件概率,作为结果打印出来了,这确实是太超前了,出乎我的意料。
这件事情,使我想起了Jeffreys-Lindley悖论(https://en.wikipedia.org/wiki/Lindley%27s_paradox):在那里,根据一个城市的男女出生的数据,来判定生男生女的比例是不是一比一,结果,频率派拒绝了这个比例,而贝叶斯派则接受了这个比例。抛开这个悖论里有关几何概率的争论不谈,我们会发现,按照贝叶斯派的玩法,我们有时出了岔子,自己都不知道。
所以,我从来不推荐贝叶斯派的概率,虽然有时我不得不用。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 15:51
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社