路漫漫其修远兮分享 http://blog.sciencenet.cn/u/zhpd55 追求科学,勇于探索,苦海无涯,愿作小舟。

博文

[转载]向博弈论和经济学界说不

已有 2708 次阅读 2021-10-10 16:32 |个人分类:数学研究|系统分类:观点评述|文章来源:转载

因杨六省老师之邀,现将其论文转载于下,仅供参考。

我自己对数学一窍不通,仅仅为开展学术交流提供方便,请行家里手进行评议或者直接与杨六省老师联系进行商讨。

向博弈论和经济学界说不

——假设囚徒A不认罪,囚徒B选择认罪是理性行为吗?

杨六省

Yangls728@163.com

1、故事

两名嫌犯AB被警方抓获,被分别关押在不同的房间里接受警方的盘问。他们被告知:如果一人认罪,另一人不认罪,认罪者可获释,不认罪者将获刑20年;如果两人都认罪,他们将均获刑10年;如果两人都不认罪,他们将均获刑1年。为下文分析比较方便起见,我们用下表反映上述内容。

image.png

两人各会有什么盘算呢?

嫌犯A可能会这样想:假设B选择认罪,我若不认罪,将获刑20年,若认罪,只获刑10年,当然选择认罪有利;假设B选择不认罪,我若也不认罪,将获刑1年,我若认罪,则可获释,显然还是认罪有利。总之,不管对方选择认罪还是不认罪,认罪对我都是最佳选择。

同样,嫌犯B的盘算结果也是认为,选择认罪是最佳方案。然而,如果两人都选择不认罪的话,他们都只会获刑1年,而不是10年。

上述这个与客观事实(指两个囚徒都应该选择不认罪的策略)相矛盾的推理结论(指两个囚徒都应该选择认罪的策略),就是著名的囚徒困境,也叫囚徒悖论。

2、假设囚徒A不认罪,囚徒B选择认罪是理性行为吗?

博弈论和经济学界普遍认为,如果囚徒A选择不认罪的策略,那么,囚徒B选择认罪策略是一种理性行为。笔者认为,这是一种认识错误。下面将给出解释。

博弈论假定所有参与人都是理性人。[1]24理性人有两个特质,一是利己,即以追求利益最大化为目标;二是理性,理性人应该具备对目的和手段进行分析和比较的能力。很显然,每个理性人知道自己是理性的,并且知道其他参与者也是理性的。

为了下面行文方便起见,我们引述几段话:

“参与人都是同时做出这些选择的。”[1]77

“策略思维在本质上是你与他人的互动,他人也同时在进行着类似的思考。……正如你必须考虑到其他选手的想法一样,别人也在考虑你所考虑的东西。博弈论就是进行这样的互动决策分析的科学。……博弈论是关于互动情形下理性行为的科学。[1]4

“如果你知道别人的行为会影响到你,你可以对他的行为做出反映,……如果你深知对方也了解你的行为将影响到他,那你也就知道他将采取类似的行为。反之亦然。[1]15

“在你做决定的时候,必须将冲突考虑在内,同时注意发挥合作的效力”[2]

下面我们就来解释上述那个认识错误。

假设对方选择不认罪的策略,如果我选择认罪的策略,对方会知道我的这一想法(注:孙子兵法,知己知彼),并知道我的策略选择将对他产生不利后果。由于做决策是同步思考的,所以,针对我的想法,对方不会坐以待毙,他将改变策略。于是,我的推理前提(假设对方选择不认罪的策略)就不复存在了,矛盾!这说明假设对方选择不认罪的策略,我选择认罪的策略并不是一种理性行为。

事实上,我们是不会承认一人认罪而另一人不认罪这种策略组合的合法性的,因为它只考虑了一方的诉求,而忽视了另一方的诉求,因此,它不满足博弈论的假设前提——每个参与者都以追求利益最大化为目标。

我们的提问不应该是单向的,而应该是反思式的:

不仅要问:假设对方选择不认罪的策略,我该如何?

还要问:如果我的应对方案是选择认罪的策略,对方又会如何?

还要再问:如果对方改变原来的策略,怎么办?(注:导致矛盾,即我的推理前提(假设对方选择不认罪的策略)不复存在)

经过一番互动(推演),又回到原来的问题:假设对方选择不认罪的策略,我究竟该如何?

只有这种反思式的提问方式,才能反映出双方进行博弈的真实过程,相反,只是“假设对方如何,我该如何?”这种单向的提问方式,就等于捆绑了对方的手脚。试问:不允许对方还手,与谁博弈,如何博弈?独角戏难道也能被称作博弈吗?简言之,在博弈论中,只采用“假设对方如何,我该如何?”这种单向提问方式,是不合理的。

消除(认罪,不认罪)的不稳定性的方法是,要么前者自觉地改变策略;要么后者无奈地改变策略,但这样做对谁都没有好处。看来,前一种方法是真正意义上的解决,因为在我们的讨论中,是不允许有非理性人存在的,或者说,纵使有非理性人的参与,我们最终也要否决它。

3、囚徒博弈最优解证明

笔者曾经对囚徒博弈最优解给出过三种证明方法。[3]下面的新证明很是简明。

证明:假设对方选择认罪的策略,很显然,我也应该选择认罪的策略。

假设对方选择不认罪的策略,如果我选择认罪的策略,对方会知道我的想法,并知道我的策略选择将对他产生不利后果。由于做决策是同步思考的,所以,针对我的想法,对方不会坐以待毙,他将改变策略。于是,我的推理前提(假设对方选择不认罪的策略)就不复存在了,矛盾!这说明我的认罪策略选择是行不通的。因此,假设对方选择不认罪的策略,则我也应该选择不认罪策略。

综上所述,无论对方选择什么策略,我都应该选择与对方相同的策略。对方也会这样想。简言之,两人的策略选择应该是一致的。

如果我选择认罪的策略,则对方也会选择认罪的策略,但这显然不是最好的方案。对方也会这样想。

于是,两人将不约而同地都选择不认罪的策略。(证完)

也许有人会说,我知道对方是一个理性人,他一定会选择不认罪的策略。所以,为了获取最大利益,我应该选择认罪的策略。我们说,理性人不会有这种想法,有这种想法的人不会是理性人,因为理性人在知道了问题的必然结论之后就不会再抛弃它。的确,这种做法在实践中可能会发生,但在理论上不具有存在性,因为如上所述,一人认罪另一人不认罪的策略组合不满足博弈论的假设前提——每个参与者都以追求利益最大化为目标。

4、结论

在假设囚徒A选择不认罪策略的情况下,囚徒B选择认罪的策略不是理性行为,相反,囚徒B选择不认罪的策略是理性行为。

 

参考文献:

[1] 阿维纳什·迪克西特、苏珊·斯克丝、戴维·赖利.策略博弈(教材版第3版)[M].蒲勇健、姚东旻等译》.北京:中国人民大学出版社,2014年,第77页.

[2] 阿维纳什·K·迪克西特、巴里·j·奈尔伯夫.策略思维:商界,政界及日常生活中的策略竞争[M].王尔山,译.北京:中国人民大学出版社,2013.序言:第2页.

[3] 杨六省.完整揭示纳什均衡概念的内涵及解决囚徒的困境[J].应用数学进展.2018,7(10).



https://blog.sciencenet.cn/blog-212210-1307448.html

上一篇:智利科学家计划用“吃金属”细菌来清理采矿
下一篇:一种新的、环保的稀土元素提取和分离方法
收藏 IP: 61.134.23.*| 热度|

1 周少祥

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-28 17:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部