思想海洋的远航分享 http://blog.sciencenet.cn/u/xying 系统科学与数学水手札记

博文

再谈“意想不到的老虎” 精选

已有 12288 次阅读 2014-1-21 08:27 |个人分类:科普|系统分类:科普集锦| 随机, 政策, 推理, 悖论, 博弈

我在《占卜与推理》里介绍了“意想不到的老虎”悖论,谈到对于这类问题逻辑推理得不出答案,用博弈的方法可以有一个最优的混合策略解,以此来说明解决具体问题的政治技巧。这篇文章给喜欢追根究底的人一个深入的博弈技术上解释。

“意想不到的老虎”,我在中学的时候读过,一直不得要领,直到近些年读了些书以后,才嚼出点味道来。

麦克向公主的父亲求婚。国王把他带到五个房间前说:“有一只老虎藏在这里,这是在你意想不到的那一个房间。你逐个把门打开。如果你足够聪明,在打开那扇门之前猜到。我就把女儿嫁给你。”

麦克想:“如果老虎在第五间,我打开前面四间的门都一定是空的,那我在打开这房间之前就能猜到它在这里。这不是意想不到的,因为它与国王断言相矛盾,所以老虎不可能在这里。(第一步)

把第五间排除了,老虎只能在剩下四个房间里。同样推理,也不可能在这最后的第四间。(第二步)

如法论证,老虎也不可能在第三,二间里。(第三,四步)

如果老虎在第一间。因为老虎是在这五个房间里,已经排除了后面所有的房间后,就不是意想不到的。所以也被否定掉。(第五步)”

 麦克信心满满地相信:如果老虎是意想不到的,就不会在这些房间里。当他依次打开第二个门时,意想不到地跳出一只老虎来。

国王说的话得到了验证,都是真的。那么麦克推理的错误在哪里呢?

这个悖论还有不同的形式,诸如 Surprise Examination Unexpected Hanging Paradox ,预测悖论等等。关于这些悖论,中文网上许多解答大同小异,大约都是从同一个地方抄来的。认为错这第一步,第二步和最后一步,各有他们的理由。但都没说到点子上。大家可以看“维基百科:老虎悖论”http://zh.wikipedia.org/wiki/%E8%80%81%E8%99%8E%E6%82%96%E8%AE%BA

英文的说出些道理,说学术界对它倍有兴趣,却没有达成一致的意见。这看似简单悖论背后的复杂性甚至可以引申出哲学上重大的问题。见“WikipediaUnexpected hanging paradoxhttp://en.wikipedia.org/wiki/Unexpected_hanging_paradox

简单地说,这是一个自我指涉的认知悖论。在逻辑上,国王提供些知识,其中有两个命题:

1. 老虎在五个房间之中。

2. 老虎所在的房间你推测不出来。

实际上这两个命题在推理下不相容,它们构成了自相矛盾的判断。你在假设下推测出老虎在任何房间都会被第二个命题否定。麦克利用它们得出老虎不在这五个房间的任何一间中。但这又与第一个命题相矛盾了。这逻辑推理的过程没有错,错在你如果认为,国王给定的知识可以用来做推理的前提,那结果则会跟给定的前提相矛盾。从不相容的几个命题出发,你可以推出任何结论。就是说你可以用其中的命题经过一定的推理路径得出某个结论,也可以经过不同的路径得出相反的结论。

麦克推出老虎不在这五个房间里,我们来看这也可以推出老虎在第五个房间。

用反证法。假设老虎不在第五间,麦克的第一步推理的结果换成了假设。按照麦克的第二,三,四,五步推理。仍然得出老虎不在这些房间里,但这结论与命题1矛盾,所以初始的假设不对。因此老虎是在第五间。

也可以推出老虎在第二个房间。

按麦克原来的第一,二,三步套路推出老虎不在第五,四,三房间。现在假设不在第二间,用假设代替第四步的结果,加上第五步结果,与上述国王命题1矛盾。依反证法,假设的反面是对的,因此老虎必须在第二间。

这样自我指涉的认知悖论,以给定的知识作为推理的根据,逻辑推理兜了一圈必定是矛盾的。你在这圈子任何一个地方断开,把结论换成了假设,一直推到矛盾时,按反证法说,假设就不对了,从而得出与假设相反的结论。

网上的一些解释是用逻辑得出与麦克的推理中一步相反的结论,然后说这一步是错了。这仍然没有跳出怪圈,依然在悖论的逻辑路子里兜圈子。按这样子,也能证明任何一部都是错的。

有人问,既然这两个命题构成一个自相矛盾的判断,为什么国王到最后还是对的?

网上也有各种解释。其实这只是国王运气好,麦克没蒙对。他要是按照前面路子推出来老虎在第二个房间。尽管是自园其说的论证,麦克只要自个儿信了,就可以牛逼哄哄地指着门说:“我推测出老虎就在这一间。”国王岂不就是错了?

从认知的观点,国王给出的知识在推理上自相矛盾,无益于推导,不能作为推理的根据。你用它们来推理,是白忙乎。国王随便将老虎关在哪个房间,都和这知识无关,也就无从据此猜测,就算你蒙对了,那也是意外的。世人的许多凭借大道理来论证的事,大抵如此。

有人嗤笑说:“这太简单了,如果这个老虎是‘意想不到的’,那么无论麦克说什么,国王都可以说他不对。因为能被你猜着了,就不是意想不到的。”

这是在语言上做文章,不过这样解读没有技术含量。悖论的目的是促进思考,很多问题并不拘于严谨的表达,而是用形象说法来揭示深刻的思想。不同人看到的是不同的问题。有能力的看到的是难点,不纠结于浅显的枝节以免忽略本质。“意想不到”这话比较含糊,故事中国王这句话其实只是提个醒,有“谅你也想不到”的意思。并非用它来判决麦克的答案。答案的对错是由事实来验证的。

一位朋友跳出这个问题,从一个高度说:“既然这只老虎是‘意想不到’的,麦克怎么可能‘足够聪明,在打开那扇门之前猜到’呢?”她以女性的直觉说:“这只能解释为:国王根本就不想把女儿嫁给麦克。麦克的错误是在于,还想根据国王的话,企图用推理来猜出这‘意想不到’的结果。”这确实一针见血!

既然国王和麦克意愿相左,两人各自从不言而喻合适的大道理出发,严谨地论证自己的诉求,都觉得自己不亏理。再下去就只能是暴力解决了,文明一些,就赌个输赢。大家愿赌服输。这个故事的议题就从逻辑的问题转为博弈的问题了。

其实国王原来的意思也是随便将老虎关一个房间。看在公主的份上让麦克猜一次,有20%机会中奖,对穷屌丝也该知足了。大道理谈不拢,玩暴力你赢不了,还能怎么地?那个“你足够聪明,怎样,怎样”说法是玩政治都懂的学问,让你有点自己也可以掌握命运心灵鸡汤之类的盼头。要是麦克是黑骑士、蝙蝠侠的什么,公主一门心思又在他身上,国王也许就要考究麦克的智商了,这20%中奖机会这时有点欺负人。麦克凭他的实力宁可用拳头。

博弈的设计是政治家必修课。这里是设计个比赛规则。比如说,麦克可以猜多次,直到见着了老虎。要猜着了,10分;没猜着却见了虎,负10分;没虎蒙有时,扣些分,设为M分,接着猜。最后看积分正负定输赢。研究政策的人都该想想:这扣分M该是多少?才能让麦克和国王都觉得愿意放弃拳头,玩游戏赌输赢。

国王没什么花招可用,必须预先将老虎放入一个房间,策略分别记为12345,对应着把老虎放在编号那个房间。麦克当然可以从头到尾每个房间都说有老虎,但是老虎要是在比较后的房间,猜不中扣分很多,显得傻,未必是最好的策略。如果前面房间都没虎,后面有的概率就较大了,所以没有前面开始了猜有,后面再猜没有的道理。因此麦克比较现实的策略库是:策略1从头开始都一直说有,到猜中为止;2从第二间开始猜有,直到猜中为止;如此345类推。比如说国王的策略为4,麦克的策略为3,意味着国王把老虎放在第四个房间,麦克在第一,二房间都说没有,从第三个房间开始说有老虎,丢了M分,第四个房间蒙着了得10。这个对局麦克的得分就是10-M,把这个数值放在博弈支付矩阵的第三行第四列中。支付矩阵其他元素的赋值类推。这是一个零和的博弈,国王的得分是麦克的负值。我们可以写出麦克博弈支付矩阵如下。

选择老虎

1

2

3

4

5

1

10

10-M

10-2M

10-3M

10-4M

2

-10

10

10-M

10-2M

10-3M

3

-10

-10

10

10-M

10-2M

4

-10

-10

-10

10

10-M

5

-10

-10

-10

-10

10

 

从这矩阵看出,除非麦克蒙错了不受罚(M=0),不存在着优势策略。也就是说在这个问题上别指望国王和麦克有什么策略一定比别的高明。对于聪明人来说,这样还不够,因为胜负的概率很不同。如果麦克和国王的实力相当,什么样的M才公平呢?

公主说:“国王和麦克如果都完全随机选策略,他们的数学期望是这个博弈的平均分,它是矩阵里所有分量都加起来除25M=2.5 时这个平均分为零,这个最公平。”

这不能说错,但这是对两个都漫不经心的随机选择者而言,在弱智王国里的公平。国王如果同意这个数,就被公主忽悠了。因为麦克这时可以选第一个策略,就是每个房间前都说有老虎,无论老虎在哪个房间,都不会是负值,这就稳操胜卷了。

国王叹气说:“女大不中留呀!你把老爸当傻瓜了。这第一个策略优势太大,必须加大扣分惩罚力度才行。M=5时,这个策略的平均分是零,这才是合理。”

麦克说:“你觉得我肯定选那第一个策略?我是那个总以为别人只会盲目随机傻瓜的真正傻瓜吗?要按你说的,我所有策略没有一个是正的均值了,这能合理吗?真正合理的M值,必须使得你和我全都采用最好的策略时得分是零。”

孙子兵法云:“多算胜,少算不胜,而况于无算乎?”麦克的提议是对于两个聪明人的公平。但这要费脑筋由人及己的通盘计算。我计算过,M=3.78,是双方都没有优势策略和纯策略的博弈,只有一个混和策略的纳什均衡。国王的最优策略是以16%13%11%10%50%的概率把老虎方进房间序号12345。麦克是以50%10%11%13%16%的概率选取他的策略12345。这时候的得分的数学期望为零。这些计算是非合作博弈基础课程的内容,就不在这里多说了。

世上很多事情是用大道理辩不清的,在现实中最后的解决只能是实力的对撼,而不是基于美好的幻想。提出兵不血刃的替代方案,设计一个让大家都心甘情愿地接受现实,用风险较小的游戏来代替残酷的对决,是一种政治的艺术。对于明白人来说,公平的结果必定是一种随机的选择。




https://blog.sciencenet.cn/blog-826653-760895.html

上一篇:占卜和推理(3)
下一篇:苏格拉底有罪吗?
收藏 IP: 50.156.25.*| 热度|

18 苏德辰 冷永刚 曹裕波 任永利 张伟 钟佳 鲍海飞 鲍得海 李天成 陈冬生 徐晓 王国强 田云川 张天蓉 李超勇 decipherer lvrulan biofans

该博文允许注册用户评论 请点击登录 评论 (24 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 02:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部