|||
什么是博弈?生活之中,但有选择,凡是结果不是由单独一方便能决定,就成博弈。这时的选择便不能一厢情愿了,明智的人会考虑对方可能的选择,及自己的选择给对方的影响。博弈教你也要从对方角度看问题,研究怎样才能取得双赢。有人问:“我是个小人物,和我老板、当官的,博什么弈?社会问题用数学来描述,再漂亮的结果也是没有用。”这些人把博弈看成能让他单方面取胜的神机妙算了,或以先入为主的偏见来排斥理性的思考。其实,博弈首先教你要面对现实,学博弈告诉你不要自以为是,聪明是把大家都看作聪明人。世上的事不是一厢情愿就能搞定的,博弈教你的应对不一定都能得到期望的好结果,但学了会让你成为一个明白人。
如同我过去的科普系列一样,读者的评论和回复可以看作博文的延伸。我一般会认真地回复和解释对其他读者也感兴趣的话题。对于鼓励和欣赏的评论,我充满感激,看作是勉励我继续写作的动力,不再一一回复。对于批评和情绪性的评论,对大家有意义的我会解释,其他的就留给大家思考欣赏了。
下面先介绍一下博弈的基本概念和标准术语,以方便以后深入的讨论。我不想照教科书念,尽量用日常语言将博弈论核心思想和论证逻辑揭露出来,让你能轻松地长学问。
你和某人一起面临着“合作”和“背叛”两种选择。双方都选“合作”,大家都有好处,各得R分(Reward for mutual cooperation)。你选“合作”对方“背叛”,对方占了你的便宜,他得T分(Temptation to defect),你得S分(Sucker's payoff)。反之亦然。大家都不想吃亏,都要“背叛”,各自得了P分(Punishment for mutual defection)。这个局面可以列出一个表格如下:
| 某人 | |||||||||
你 |
|
这个局面叫着一个“博弈(Game)”。“你”和“某人”叫“局中人(Player)”或者“博弈方”。可能的选择“合作”和“背叛”叫做“策略(Strategy)”。表格中的数值左边是局中人(你)选择相应那一行策略及对方选择相应那一列策略时的得益,右边是对方(某人)的得益,整个表格称为“支付矩阵(Payoff Matrix)”。从博弈的观点来看,策略的名字并不重要。支付矩阵中的具体数值对定性结果也不重要。重要的是他们之间相对的大小。当数值大小T > R > P > S时,这个博弈就叫做“囚徒困境”。博弈研究的是局中人怎样选择自己的策略来最优化自己的得益。用这个方法,前面Bob和Al的局面及公司价格大战的支付矩阵分别表示如下。
|
|
|
他们都是囚徒困境博弈。在价格大战中,双方都维持高价都能得5万利润,这个“高价”就是一般化模型中的“合作”策略,R=5。一方降价,采用的是“背叛”策略抢了高价要“合作”方的市场,这里T=6, S=1, P=3。
博弈方的策略可以是可行策略中的某一个,也可以是按某种概率随机选择,前者叫“纯策略”,后者为“混合策略”。如果博弈各方所选择的策略组合使得博弈处在这样的状况:谁单方面的改变自己的策略都对自己没有好处,那么这个策略组合就称为“纳什均衡(Nash Equilibrium)”。这是非合作博弈的核心概念。一个有限策略的博弈不一定有严格优势策略,但至少有一个纳什均衡。一旦进入纳什均衡状态,从利益角度就难以单方面改变了。纳什就凭着这个概念和存在性的证明奠定了非合作博弈的基础,因此得了诺贝尔奖。
用前面故事里Bob的相同思路可以证明:囚徒困境双方都会明智地选择“背叛”这个不需要玩概率的“纯策略”。而这一对策略就是“纳什均衡”,并且是唯一的。虽然要是大家都选“合作”,都会更好些(R > P)。但谁要是一厢情愿相信对方会合作,结果被背叛了就会落入更惨的下场。
悲剧呀!囚徒困境博弈的纳什均衡不就是告诉你:自私自利没有好结果,但谁也身不由己地陷进去!
这困境就对亚当·斯密的“看不见的手”的原理提出问题了。这位经济学大佬在《国富论》中说:“通过追求个人的自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”而囚徒困境中我们看到的却是:从利己出发的决定,结果是损人不利己。要都是这样的话,就会动摇了西方经济学的基石。
但是自然界自私的生物合作现象的确是广泛地存在,这又该怎么解释?
有人说:“我明白!你上面的例子是一锤子买卖,小人也是难免有的。要还常来常往,就可能放弃眼前好处着眼于长远利益。”
也对,这要用到重复博弈的模型。重复博弈讲的是将相同的博弈重复地来玩,用于一直面对相同局面的情况。
让我们用逆推归纳法来推理:考察最后一次的博弈,比如说第一万次。无论前面怎么样,这最后一次不必为将来打算了,这也就跟一锤子买卖一样,所以大家都自私地选择“背叛”。然后考察倒数第二,第九千九百九十九次。因为最后一次策略已定,那不管怎么委屈自己也换不来回报了,所以还是能合算就多合算点,结果也是“背叛”。一直照此倒推到第一次,结果全是一溜的做小人不要合作的嘴脸。
博弈论的有限次重复博弈的一个定理就是用这个思路来证明的。有限次囚徒困境的重复博弈仍然因为自私而陷入无法合作的局面。
“唉!千万不要和自私的人交往,一点亏都不肯吃,这样逆推的算计,再多的交往也白搭。”
我的朋友不耐烦了:“早说了,这里用不着这么算计。君子喻于义,小人喻于利!能合作吗?”
但人际关系和博弈考虑的都不是一厢情愿就可以解决的问题。你怎么知道对方是君子还是小人?如果是小人,你喻之于义能解决问题吗?还有低等生物在囚徒困境的环境中也能合作,难道它们都喻于义吗?
这合作现象仍然成谜,博弈论还有什么招呢?
(待续)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 04:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社