博文

从贝叶斯定律的角度理解“蒙提霍尔问题”和“三个囚犯问题” 精选

已有 37088 次阅读 2014-3-21 01:24 |系统分类:教学心得

在当助教上习题课的时候，我觉得以下两个例子对帮助本科生理解贝叶斯定律很有帮助，也挺能活跃课堂气氛。一个是著名的“蒙提霍尔问题”，另一个是“三个囚犯问题”。我知道很多大牛都介绍过这两个问题，比如雷奥奇·卡塞拉的《统计推断》在第一章就介绍了“三个囚犯问题”；“蒙提霍尔问题”的最简单直观解法是穷举法，不过我很少见到用贝叶斯定理来解释这两个问题的。于是，楼主就从贝叶斯定律的角度写一写我对这两个问题的理解。

题目的描述摘自（最具争议的12个数学事实【注1】）。

哈哈，这文章名字取得有点吹牛，不是我写的啊，我照搬题目而已。

第一个，先说个简单的吧，（三个囚犯问题）：

三个犯人都住在隔离间，并且都被判处了死刑。法官随机赦免了其中一个犯人。看守知道谁会被赦免，但不会说。

*犯人A脸皮厚，让看守告诉他，B和C谁会被执行死刑。

*如果赦免的是B，看守就说C；如果赦免的是C，看守就说B；如果赦免的是A，那么看守就投硬币决定说B和C中的一个。

*看守告诉A，犯人B将会被执行死刑。

*犯人A兴奋不已，觉得自己生存的几率从1/3提升到了1/2,因为原来是A,B,C三个人有一个人被赦免，现在是A，C两个人有一个被赦免。

*A将此告诉了C，C同样兴奋不已，他认为：A生存的几率仍然是1/3，而C却有了2/3的几率被赦免。

*问题是，他们说的对呢？看守的回答又是如何影响A被释放的概率呢？

好吧，让我们来分析一下这个问题。首先，根据题意，看守是不会说假话的，因此，B是不可能被释放的，在知道了看守的回答之后，B被释放的概率是0。

我们首先定义随机事件：

A：A被释放。

B：看守说B会被处决。

C：C被释放。

我们需要知道后验概率P（A|B），逆向的概率不是很直观，于是我们用贝叶斯定理。因为在不知道看守的话的时候，P（A）表示A被释放的先验概率，等于 1/3。我们还知道P（B|A），也就是法官选中了A的前提下看守说B被处决的概率，根据题目，是1/2。最后我们还需要P（B）的概率，也就是“看守说 B会被处决”这一事件的概率，这一事件的成立只可能可能来自两个原因：A被释放，看守丢硬币丢到了B；或者是C被释放，看守说B会被处决。于是我们得到：P（B）=P（A）*P（B|A）+P（C）*P（B|C）。其中，P（B|C）表示C被释放的前提下看守说B被处决的概率，是1。综上所述，我们得到：

$\begin{array}{lcl} P(A|B)&=&\dfrac{P(B|A)P(A)}{P(B|A)P(A)+P(B|C)P(C)}\\ &=&\dfrac{1/2\times 1/3}{1/2\times 1/3+1\times 1/3}\\ &=&\dfrac{1}{3} \end{array}$

相应的，在知道B被处决的情况下，C被释放的概率就是P(C|B)=1-P(A|B)，因为不是A就是C被释放嘛。所以在知道B被处决的情况下，C被释放的几率是2/3。

计算结束了，我们发现C是对的，看守的话并没有提供给A任何关于他被释放的信息。当然，如果看守用别的方法来选择说谁会被处决，那么“B被处决”这句话可能就和“A被释放”相关了。总之，这个故事告诉我们，看似相关的随机事件不一定能影响彼此发生的概率。

换句话说，C认为看守告诉A “B会被处决” 这件事情和 “A被释放” 这件事情是独立的（P(A|B)=P(A)）。意思是看守没有告诉A任何他想知道的信息。在这个问题中，反直觉的地方在于“B会被处决”和"A被释放"居然是无关的。

第二个（蒙提霍尔问题）：

在蒙提霍尔游戏节目中，让玩家在三扇关着的门中选择，知道一扇门后面是跑车，其他俩都是山羊，当然假设玩家希望选中赢的是跑车。当玩家选择后告诉主持人他的选择之后，由于主持人知道车在什么地方，主持人采用以下策略：如果玩家选择的门后是羊，他打开另外一扇有羊的门；而如果玩家选择的门后是车，主持人随机的打开剩下两扇门中的一个。举个不失一般性的例子，假设玩家选择1号门，主持人打开的是3号。然后问玩家，要不要改主意选2号。问：改选是不是更有利，改选之后选中跑车的概率是多少？

如果对题目不是很清楚，可以看一下下面这个链接 http://blog.sciencenet.cn/blog-826653-669134.html(应行仁老师的博客)

这个问题比较难，也是著名的反直觉的例子，二十年前这个问题被提出的时候，据说很多拥有博士头衔的大哥们给出了错误的答案。以下文字摘抄自应行仁老师的科学网博客：

“大多数人认为改不改都一样，因为没打开的两扇门后面，有车子的可能性都是1/2。而Marilyn vos Savant认为1号门的可能性是1/3，2号现在有2/3。

这个专栏写手Marilyn vos Savant是吉利斯记录中拥有最高智商的女人，IQ 228。她在Washington University in St. Louis哲学系上了两年大学后，就退学挣钱，以便有自由来写作。

她的答案打击了大多数人们的直觉，当即收到几千封读者的反驳，11月著名问题专栏作家的Cecil Adams也在他 “The Straight Dope”专栏里讨论这个问题，持相反看法。第二年《纽约时报》在头版登出这个问题，并且访谈了这问题中的节目主持人蒙提霍尔。他也不认可。vos Savant仍然坚持原来的答案。她摊上大事了，报社收到了一万多人来信，92%认为她错了，65%来自大学的信，多数是来自数学和科学的院系，都反对她的答案，认为这只是女人的直觉，劝她修了概率课后再谈这问题。其中有一千多个署名上有博士学位。即使她重申主持人必须打开有羊门的假设，提供了进一步证明后，仍被大多数有学问的人怀疑。没有被她说服的名人包括Paul Erdős，他是最多产的数学家，研究的问题包括组合数学、图论、数论、经典分析、逼近理论、集合论和概率论。

反对者的直觉是：主持人打开了一扇门，里面是羊，这将三个选择去掉一个，一辆车子和一只羊分别在剩下两扇没打开的门中，它们各有1/2的概率是车。”

这里奇怪的地方在于，排除掉一个错误答案之后，居然没有改变我选择的门后是山羊的的概率。而另一个门后是山羊的概率居然大大的增加了。

当然啦，这个问题的分析和解法很多很多了，不过今天楼主想用贝叶斯定理对这个问题建模，让我们来看一看，“你选择了1号门，而主持人打开了3号门并且3号门后面是山羊”这样一个信息，是如何影响你所关心的门后是汽车的概率的。

我们首先设定以下三个随机事件：

A：1号门后是汽车。

B：2号门后是汽车。

C：你选择了1号门，而主持人打开了3号门并且3号门后面是山羊。

（请注意，此处C事件的设置非常关键，并不是简单地“3号门后是山羊”【注2】。）

我们首先来看1号门，我们的目标是P（A|C），即在得到主持人信息之后1号门后是汽车的概率。在主持人提供信息之前，我们有P（A）=1/3。第二个问题是，P（C|A）表示在知道了1号门后是汽车的前提下，C发生的几率，仔细想想是1/2，因为主持人会随机的打开一扇门后有羊的门。

那么最关键的是，P(C)，也就是主持人按C描述的那么做的概率是多少呢？我们先设定

A非：1号门后是山羊。因此 P（A非）=1-P（A）=2/3。

于是，P（C | A非）表示在知道了1号门后是山羊的情况下，主持人打开3号门并且后面是山羊的几率，这个概率仍然是1/2，因为这是给定一号门后是山羊的前提下，三号门后是另一个山羊的概率。啊，大伙千万别喊晕啊，我也没办法，就是这么绕。如果这段看不懂，那就直接看结论吧。

结论是，贝叶斯公示的分母是：

P(C)=P（A）*P（C|A）+P（A非）*P（C | A非）=1/3*1/2+2/3*1/2=1/2。

于是，根据贝叶斯公式：

$\begin{array}{lcl} P(A|C)&=&\dfrac{P(C|A)P(A)}{P(C|A)P(A)+P(C|\bar{A})P(\bar{A})}\\ &=&\dfrac{1/2\times 1/3}{1/2\times 1/3+1/2\times 2/3}\\ &=&\dfrac{1}{3} \end{array}$

其中由于打字的原因，“A非”被写成了 $\bar{A}$ 。

这下我们证明了主持人虽然排除一个错误答案，但是并没有改变参赛者第一个选择是否成功的几率。

类似的，我们再看第二扇门，因为在已知第三扇门后是山羊的前提下，车不在第一扇门后就是在第二扇门后。所以P(B|C)=1-P(A|C)=2/3。当然，有兴趣的同学也可以再用一遍贝叶斯公式计算 P(C|B)P(B)，也会得出同样结果，我就不加分析的直接给答案了：

$\begin{array}{lcl} P(B|C)&=&\dfrac{P(C|B)P(B)}{P(C|B)P(B)+P(C|\bar{B})P(\bar{B})}\\ &=&\dfrac{1\times 1/3}{1\times 1/3+1/4\times 2/3}\\ &=&\dfrac{2}{3} \end{array}$

同样由于公式编辑器的原因，“C非”被写成了 $\bar{C}$ 。

好累呀，在漫长的跋涉之后，我们终于发现了，如果不换门，其实主持人行为没有改变中奖的几率，就算他排除了一个错误答案。而主持人行为，让另一扇门后是汽车的几率大大增加了。

有以下几点要分析一下：

1. 细心的读者可能已经发现了，第二个问题其实和第一个问题是一个问题，如果把参赛者选择1号门当做一个已经发生的事情，那么主持人做的事情和上一题中看守做的事情没有任何不同。如果车在一号门，他在剩下两个门里随机抽一个告诉参赛者门后是羊。如果车不在一号门，他就选一个相反的展示给我。

2. 还有很重要的一点，是为什么很多人觉得在知道三号门后是羊之后，二号门和一号门后是车的概率都被提升到1/2了呢？楼主认为他们可能没正确理解题意吧。如果是主持人先排除掉一个错误答案，然后让参赛者选择一个门，那么剩下两个门后是汽车的概率就都变为1/2了。

3.有兴趣的同学可以考虑下N扇门的情况，在参赛者做出选择主持人排除掉一个错误答案之后，剩下N-2扇门和第一次选的门有什么区别么？

4. 楼主认为这种问题可以拿来问问女友，看看女友有没有对科学的sense，不需要让她定量的说概率变成了多少，只要她凭直觉回答换还是不换就好了。

楼主想说：我对贝叶斯定理的理解呢，是定量描述信息是如何影响随机事件发生的概率。或者说，本来某个随机事件发生的几率是P（A），在得到某个信息 I 之后，此随机事件发生的几率就变成了P（A| I）。贝叶斯定理告诉我们，信息是如何将先验知识P（A）变成后验知识 P（A| I）的，这也是贝叶斯定理的物理意义。

最后，我希望我没有写错。-__-!

【注1】：可以在徐林同学的日志中找到这些题目：

http://blog.renren.com/blog/322854618/904754616

【注2】：在应行仁老师的博客里，可以看到如果把第二题的C事件定义为“3号门后是山羊”，再用贝叶斯公式就会出现换不换门都一样的错误。

转载本文请联系原作者获取授权，同时请注明本文来自王云龙科学网博客。
链接地址：https://blog.sciencenet.cn/blog-624263-777817.html

下一篇：在国外大学监考有感

收藏 IP: 129.49.68.*| 热度|

当前推荐数：8 推荐人：徐传胜 彭彬 陆泽橼 高建国 田云川 杨正瓴 王春艳 yonghuidong

该博文允许注册用户评论请点击登录评论 (19 个评论)

数据加载中...

返回顶部

博文发布时间已经超过87600小时，评论已关闭。

王云龙

扫一扫，分享此博文

yunlongwang的个人博客分享 http://blog.sciencenet.cn/u/yunlongwang

博文

从贝叶斯定律的角度理解“蒙提霍尔问题”和“三个囚犯问题” 精选

当前推荐数：8 推荐人：徐传胜 彭彬 陆泽橼 高建国 田云川 杨正瓴 王春艳 yonghuidong

该博文允许注册用户评论请点击登录评论 (19 个评论)

王云龙

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

yunlongwang的个人博客分享 http://blog.sciencenet.cn/u/yunlongwang

博文

从贝叶斯定律的角度理解“蒙提霍尔问题”和“三个囚犯问题” 精选

当前推荐数：8 推荐人： 徐传胜 彭彬 陆泽橼 高建国 田云川 杨正瓴 王春艳 yonghuidong

该博文允许注册用户评论 请点击登录 评论 (19 个评论)

王云龙

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：8 推荐人：徐传胜彭彬陆泽橼高建国田云川杨正瓴王春艳 yonghuidong

该博文允许注册用户评论请点击登录评论 (19 个评论)