yunlongwang的个人博客分享 http://blog.sciencenet.cn/u/yunlongwang

博文

从贝叶斯定律的角度理解“蒙提霍尔问题”和“三个囚犯问题” 精选

已有 11883 次阅读 2014-3-21 01:24 |系统分类:教学心得

在当助教上习题课的时候,我觉得以下两个例子对帮助本科生理解贝叶斯定律很有帮助,也挺能活跃课堂气氛。一个是著名的“蒙提霍尔问题”,另一个是“三个囚犯问题”。我知道很多大牛都介绍过这两个问题,比如雷奥奇·卡塞拉的《统计推断》在第一章就介绍了“三个囚犯问题”;“蒙提霍尔问题”的最简单直观解法是穷举法,不过我很少见到用贝叶斯定理来解释这两个问题的。于是,楼主就从贝叶斯定律的角度写一写我对这两个问题的理解。


题目的描述摘自(最具争议的12个数学事实【注1】)。


哈哈,这文章名字取得有点吹牛,不是我写的啊,我照搬题目而已。


第一个,先说个简单的吧,(三个囚犯问题):

三个犯人都住在隔离间,并且都被判处了死刑。法官随机赦免了其中一个犯人。看守知道谁会被赦免,但不会说。

*犯人A脸皮厚,让看守告诉他,B和C谁会被执行死刑。


*如果赦免的是B,看守就说C;如果赦免的是C,看守就说B;如果赦免的是A,那么看守就投硬币决定说B和C中的一个。

*看守告诉A,犯人B将会被执行死刑。

*犯人A兴奋不已,觉得自己生存的几率从1/3提升到了1/2,因为原来是A,B,C三个人有一个人被赦免,现在是A,C两个人有一个被赦免。

*A将此告诉了C,C同样兴奋不已,他认为:A生存的几率仍然是1/3,而C却有了2/3的几率被赦免。

*问题是,他们说的对呢?看守的回答又是如何影响A被释放的概率呢?

 

好吧,让我们来分析一下这个问题。首先,根据题意,看守是不会说假话的,因此,B是不可能被释放的,在知道了看守的回答之后,B被释放的概率是0。

我们首先定义随机事件:

A:A被释放。

B:看守说B会被处决。

C:C被释放。

我 们需要知道后验概率P(A|B),逆向的概率不是很直观,于是我们用贝叶斯定理。因为在不知道看守的话的时候,P(A)表示A被释放的先验概率,等于 1/3。我们还知道P(B|A),也就是法官选中了A的前提下看守说B被处决的概率,根据题目,是1/2。最后我们还需要P(B)的概率,也就是“看守说 B会被处决”这一事件的概率,这一事件的成立只可能可能来自两个原因:A被释放,看守丢硬币丢到了B;或者是C被释放,看守说B会被处决。于是我们得 到:P(B)=P(A)*P(B|A)+P(C)*P(B|C)。其中,P(B|C)表示C被释放的前提下看守说B被处决的概率,是1。综上所述,我们得 到:




相应的,在知道B被处决的情况下,C被释放的概率就是P(C|B)=1-P(A|B),因为不是A就是C被释放嘛。所以在知道B被处决的情况下,C被释放的几率是2/3。

计算结束了,我们发现C是对的,看守的话并没有提供给A任何关于他被释放的信息。当然,如果看守用别的方法来选择说谁会被处决,那么“B被处决”这句话可能就和“A被释放”相关了。总之,这个故事告诉我们,看似相关的随机事件不一定能影响彼此发生的概率。

 

换句话说,C认为看守告诉A “B会被处决” 这件事情和 “A被释放” 这件事情是独立的(P(A|B)=P(A))。意思是看守没有告诉A任何他想知道的信息。在这个问题中,反直觉的地方在于“B会被处决”和"A被释放"居然是无关的。


 

第二个(蒙提霍尔问题):

在 蒙提霍尔游戏节目中,让玩家在三扇关着的门中选择,知道一扇门后面是跑车,其他俩都是山羊,当然假设玩家希望选中赢的是跑车。当玩家选择后告诉主持人他的选择之后,由于主持人知道车在什么地方,主持人采用以下策略: 如果玩家选择的门后是羊,他打开另外一扇有羊的门;而如果玩家选择的门后是车,主持人随机的打开剩下两扇门中的一个。举个不失一般性的例子,假设玩家选择1号门,主持人打 开的是3号。然后问玩家,要不要改主意选2号。问:改选是不是更有利,改选之后选中跑车的概率是多少?


如果对题目不是很清楚,可以看一下下面这个链接 http://blog.sciencenet.cn/blog-826653-669134.html(应行仁老师的博客)

这个问题比较难,也是著名的反直觉的例子,二十年前这个问题被提出的时候,据说很多拥有博士头衔的大哥们给出了错误的答案。以下文字摘抄自应行仁老师的科学网博客:

“大多数人认为改不改都一样,因为没打开的两扇门后面,有车子的可能性都是1/2。而Marilyn vos Savant认为1号门的可能性是1/3,2号现在有2/3。

这个专栏写手Marilyn vos Savant是吉利斯记录中拥有最高智商的女人,IQ 228。她在Washington University in St. Louis哲学系上了两年大学后,就退学挣钱,以便有自由来写作。

她 的答案打击了大多数人们的直觉,当即收到几千封读者的反驳,11月著名问题专栏作家的Cecil Adams也在他 “The Straight Dope”专栏里讨论这个问题,持相反看法。第二年《纽约时报》在头版登出这个问题,并且访谈了这问题中的节目主持人蒙提霍 尔。他也不认可。vos Savant仍然坚持原来的答案。她摊上大事了,报社收到了一万多人来信,92%认为她错了,65%来自大学的信,多数是来自数 学和科学的院系,都反对她的答案,认为这只是女人的直觉,劝她修了概率课后再谈这问题。其中有一千多个署名上有博士学位。即使她重申主持人必须打开有羊门 的假设,提供了进一步证明后,仍被大多数有学问的人怀疑。没有被她说服的名人包括Paul Erdős,他是最多产的数学家,研究的问题包括组合数学、图 论、数论、经典分析、逼近理论、集合论和概率论。

反对者的直觉是:主持人打开了一扇门,里面是羊,这将三个选择去掉一个,一辆车子和一只羊分别在剩下两扇没打开的门中,它们各有1/2的概率是车。”

这里奇怪的地方在于,排除掉一个错误答案之后,居然没有改变我选择的门后是山羊的的概率。而另一个门后是山羊的概率居然大大的增加了。

 

当然啦,这个问题的分析和解法很多很多了,不过今天楼主想用贝叶斯定理对这个问题建模,让我们来看一看,“你选择了1号门,而主持人打开了3号门并且3号门后面是山羊”这样一个信息,是如何影响你所关心的门后是汽车的概率的。

我们首先设定以下三个随机事件:

A:1号门后是汽车。

B:2号门后是汽车。

C:你选择了1号门,而主持人打开了3号门并且3号门后面是山羊。

(请注意,此处C事件的设置非常关键,并不是简单地“3号门后是山羊”【注2】。)

我们首先来看1号门,我们的目标是P(A|C),即在得到主持人信息之后1号门后是汽车的概率。在主持人提供信息之前,我们有P(A)=1/3。第二个问题是,P(C|A)表示在知道了1号门后是汽车的前提下,C发生的几率,仔细想想是1/2,因为主持人会随机的打开一扇门后有羊的门。

那么最关键的是,P(C),也就是主持人按C描述的那么做的概率是多少呢?我们先设定

A非:1号门后是山羊。因此 P(A非)=1-P(A)=2/3。

于 是,P(C | A非)表示在知道了1号门后是山羊的情况下,主持人打开3号门并且后面是山羊的几率,这个概率仍然是1/2,因为这是给定一号门后是山羊的前提下,三号门 后是另一个山羊的概率。啊,大伙千万别喊晕啊,我也没办法,就是这么绕。如果这段看不懂,那就直接看结论吧。

结论是,贝叶斯公示的分母是:

P(C)=P(A)*P(C|A)+P(A非)*P(C | A非)=1/3*1/2+2/3*1/2=1/2。

于是,根据贝叶斯公式:


其中由于打字的原因,“A非”被写成了


这下我们证明了主持人虽然排除一个错误答案,但是并没有改变参赛者第一个选择是否成功的几率。

类似的,我们再看第二扇门,因为在已知 第三扇门后是山羊的前提下,车不在第一扇门后就是在第二扇门后。所以P(B|C)=1-P(A|C)=2/3。当然,有兴趣的同学也可以再用一遍贝叶斯公 式计算    P(C|B)P(B),也会得出同样结果,我就不加分析的直接给答案了:


同样由于公式编辑器的原因,“C非”被写成了

好累呀,在漫长的跋涉之后,我们终于发现了,如果不换门,其实主持人行为没有改变中奖的几率,就算他排除了一个错误答案。而主持人行为,让另一扇门后是汽车的几率大大增加了。

有以下几点要分析一下:

1. 细心的读者可能已经发现了,第二个问题其实和第一个问题是一个问题,如果把参赛者选择1号门当做一个已经发生的事情,那么主持人做的事情和上一题中看守做 的事情没有任何不同。如果车在一号门,他在剩下两个门里随机抽一个告诉参赛者门后是羊。如果车不在一号门,他就选一个相反的展示给我。

2. 还有很重要的一点,是为什么很多人觉得在知道三号门后是羊之后,二号门和一号门后是车的概率都被提升到1/2了呢?楼主认为他们可能没正确理解题意吧。如果是主持人先排除掉一个错误答案,然后让参赛者选择一个门,那么剩下两个门后是汽车的概率就都变为1/2了。

3.有兴趣的同学可以考虑下N扇门的情况,在参赛者做出选择主持人排除掉一个错误答案之后,剩下N-2扇门和第一次选的门有什么区别么?

4. 楼主认为这种问题可以拿来问问女友,看看女友有没有对科学的sense,不需要让她定量的说概率变成了多少,只要她凭直觉回答换还是不换就好了。

 

楼主想说:我对贝叶斯定理的理解呢,是定量描述信息是如何影响随机事件发生的概率 。或者说,本来某个随机事件发生的几率是P(A),在得到某个信息 I 之后,此随机事件发生的几率就变成了P(A| I)。贝叶斯定理告诉我们,信息是如何将先验知识P(A)变成后验知识 P(A| I)的,这也是贝叶斯 定理的物理意义。


最后,我希望我没有写错。-__-!


【注1】:可以在徐林同学的日志中找到这些题目:

http://blog.renren.com/blog/322854618/904754616

【注2】:在应行仁老师的博客里,可以看到如果把第二题的C事件定义为“3号门后是山羊”,再用贝叶斯公式就会出现换不换门都一样的错误。




http://blog.sciencenet.cn/blog-624263-777817.html


下一篇:在国外大学监考有感
收藏 分享 举报

8 徐传胜 彭彬 陆泽橼 高建国 田云川 杨正瓴 王春艳 yonghuidong

该博文允许注册用户评论 请点击登录 评论 (10 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2017-11-19 01:44

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社

返回顶部