思想海洋的远航分享 http://blog.sciencenet.cn/u/xying 系统科学与数学水手札记

博文

从自私走向合作——2博弈的均衡 精选

已有 6784 次阅读 2013-4-4 07:56 |个人分类:科普|系统分类:科普集锦| 合作, 博弈

什么是博弈?生活之中,但有选择,凡是结果不是由单独一方便能决定,就成博弈。这时的选择便不能一厢情愿了,明智的人会考虑对方可能的选择,及自己的选择给对方的影响。博弈教你也要从对方角度看问题,研究怎样才能取得双赢。有人问:“我是个小人物,和我老板、当官的,博什么弈?社会问题用数学来描述,再漂亮的结果也是没有用。”这些人把博弈看成能让他单方面取胜的神机妙算了,或以先入为主的偏见来排斥理性的思考。其实,博弈首先教你要面对现实,学博弈告诉你不要自以为是,聪明是把大家都看作聪明人。世上的事不是一厢情愿就能搞定的,博弈教你的应对不一定都能得到期望的好结果,但学了会让你成为一个明白人。

 

如同我过去的科普系列一样,读者的评论和回复可以看作博文的延伸。我一般会认真地回复和解释对其他读者也感兴趣的话题。对于鼓励和欣赏的评论,我充满感激,看作是勉励我继续写作的动力,不再一一回复。对于批评和情绪性的评论,对大家有意义的我会解释,其他的就留给大家思考欣赏了。

 

下面先介绍一下博弈的基本概念和标准术语,以方便以后深入的讨论。我不想照教科书念,尽量用日常语言将博弈论核心思想和论证逻辑揭露出来,让你能轻松地长学问。

 

你和某人一起面临着“合作”和“背叛”两种选择。双方都选“合作”,大家都有好处,各得R分(Reward for mutual cooperation)。你选“合作”对方“背叛”,对方占了你的便宜,他得T分(Temptation to defect),你得S分(Sucker's payoff)。反之亦然。大家都不想吃亏,都要“背叛”,各自得了P分(Punishment for mutual defection)。这个局面可以列出一个表格如下:

 

某人

合作

背叛

合作

RR

ST

背叛

TS

PP

  

这个局面叫着一个“博弈(Game)”。“你”和“某人”叫“局中人(Player)”或者“博弈方”。可能的选择“合作”和“背叛”叫做“策略(Strategy)”。表格中的数值左边是局中人(你)选择相应那一行策略及对方选择相应那一列策略时的得益,右边是对方(某人)的得益,整个表格称为“支付矩阵(Payoff Matrix)”。从博弈的观点来看,策略的名字并不重要。支付矩阵中的具体数值对定性结果也不重要。重要的是他们之间相对的大小。当数值大小T > R > P > S时,这个博弈就叫做“囚徒困境”。博弈研究的是局中人怎样选择自己的策略来最优化自己的得益。用这个方法,前面BobAl的局面及公司价格大战的支付矩阵分别表示如下。

 

 

             Al

 

Bob

 

抵赖

招供

抵赖

-1-1

-150

招供

0-15

-10-10

 

 

 

 

                公司B

 

公司A

高价

降价

高价

55

16

降价

61

33

 

 

他们都是囚徒困境博弈。在价格大战中,双方都维持高价都能得5万利润,这个“高价”就是一般化模型中的“合作”策略,R=5。一方降价,采用的是“背叛”策略抢了高价要“合作”方的市场,这里T=6, S=1, P=3

 

博弈方的策略可以是可行策略中的某一个,也可以是按某种概率随机选择,前者叫“纯策略”,后者为“混合策略”。如果博弈各方所选择的策略组合使得博弈处在这样的状况:谁单方面的改变自己的策略都对自己没有好处,那么这个策略组合就称为“纳什均衡(Nash Equilibrium)”。这是非合作博弈的核心概念。一个有限策略的博弈不一定有严格优势策略,但至少有一个纳什均衡。一旦进入纳什均衡状态,从利益角度就难以单方面改变了。纳什就凭着这个概念和存在性的证明奠定了非合作博弈的基础,因此得了诺贝尔奖。

 

用前面故事里Bob的相同思路可以证明:囚徒困境双方都会明智地选择“背叛”这个不需要玩概率的“纯策略”。而这一对策略就是“纳什均衡”,并且是唯一的。虽然要是大家都选“合作”,都会更好些(R > P)。但谁要是一厢情愿相信对方会合作,结果被背叛了就会落入更惨的下场。

 

悲剧呀!囚徒困境博弈的纳什均衡不就是告诉你:自私自利没有好结果,但谁也身不由己地陷进去!

 

这困境就对亚当·斯密的“看不见的手”的原理提出问题了。这位经济学大佬在《国富论》中说:“通过追求个人的自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”而囚徒困境中我们看到的却是:从利己出发的决定,结果是损人不利己。要都是这样的话,就会动摇了西方经济学的基石。

 

但是自然界自私的生物合作现象的确是广泛地存在,这又该怎么解释?

 

有人说:“我明白!你上面的例子是一锤子买卖,小人也是难免有的。要还常来常往,就可能放弃眼前好处着眼于长远利益。”

 

也对,这要用到重复博弈的模型。重复博弈讲的是将相同的博弈重复地来玩,用于一直面对相同局面的情况。

 

让我们用逆推归纳法来推理:考察最后一次的博弈,比如说第一万次。无论前面怎么样,这最后一次不必为将来打算了,这也就跟一锤子买卖一样,所以大家都自私地选择“背叛”。然后考察倒数第二,第九千九百九十九次。因为最后一次策略已定,那不管怎么委屈自己也换不来回报了,所以还是能合算就多合算点,结果也是“背叛”。一直照此倒推到第一次,结果全是一溜的做小人不要合作的嘴脸。

 

博弈论的有限次重复博弈的一个定理就是用这个思路来证明的。有限次囚徒困境的重复博弈仍然因为自私而陷入无法合作的局面。

 

“唉!千万不要和自私的人交往,一点亏都不肯吃,这样逆推的算计,再多的交往也白搭。”

 

我的朋友不耐烦了:“早说了,这里用不着这么算计。君子喻于义,小人喻于利!能合作吗?”

 

但人际关系和博弈考虑的都不是一厢情愿就可以解决的问题。你怎么知道对方是君子还是小人?如果是小人,你喻之于义能解决问题吗?还有低等生物在囚徒困境的环境中也能合作,难道它们都喻于义吗?

 

这合作现象仍然成谜,博弈论还有什么招呢?

 

(待续)

 



https://blog.sciencenet.cn/blog-826653-676731.html

上一篇:从自私走向合作——1问题的产生
下一篇:从自私走向合作——3有尊严才能和睦
收藏 IP: 50.131.158.*| 热度|

19 曹聪 李伟钢 王浩 刘立 徐晓 徐大彬 郑小康 杨锦忠 王恪铭 吕乃基 邹斌 罗春元 陈冬生 霍艾伦 何巧巧 康娴 anran123 clp286 sowhathen

该博文允许注册用户评论 请点击登录 评论 (14 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 22:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部