思想海洋的远航分享 http://blog.sciencenet.cn/u/xying 系统科学与数学水手札记

博文

从自私走向合作——5短视的原因 精选

已有 5785 次阅读 2013-4-10 07:25 |个人分类:科普|系统分类:科普集锦| 合作, 博弈

上一篇用囚徒困境的两个不等式,解释了高速发展转型期,很多人无论出自贪婪还是自保,纷纷叛离社会合作现象的原因,和可能的应对办法。

 

这两个支付矩阵赋值的不等式,揭示了现实世界合作环境的许多秘密。有些读者希望对此作更详细的介绍,我就加写了这篇来讲解它们的推导和解读,演示如何应用博弈知识研究实际问题。这些推导演绎,只需要中学的数学知识和逻辑的头脑便能理解。

 

囚徒困境是这样的一个局势:明知合作可以双赢,利益的诱惑让人们背叛了合作,从可能的双赢走向双输。这是在生物界和人际关系中经常存在的一种局势,在现实中这种局势下的合作还是经常可见,人们常常把它解释为性善或者道德教化的结果,其实这两者只是表面上的一种现象,支撑着它们的背后,必定有着能让信仰者真正受益的道理,否则迂腐无用的教诲,必然会被人耻笑而束之高阁。

 

这前面两篇解释了囚徒困境,在重覆博弈时采用触发策略,就有可能走向合作。触发策略是一种对背叛行为报复的威慑性警告,它能让唯利是图的人从自己长远利益出发,克服眼前短期利益的诱惑,自觉地进行合作。但是面临着同样的囚徒困境局面,为什么有时候社会十分和谐,合作和诚信能被人们广泛地遵守,有时候则充满着背信和欺诈?这就必须深入考察触发策略促进合作的机制,从量的关系来理解它们的不同。

 

囚徒困境的支付矩阵表示如下。注意有T> R > P > ST是背叛的获益,R是合作的收益,P是互斗时收益,S是被人背叛后的收益,这些收益也有可能是负值。

 

某人

合作

背叛

合作

RR

ST

背叛

TS

PP

 

对背叛行为报复的威慑性警告能起作用,是因为人们在乎以后再次博弈的收益,所以能够抑制短期利益的诱惑,而继续合作。记W为下次博弈收益的折扣率,这是一个正数,它把下一次可能的博弈收益V折算到现在的收益为:V/(1+W),这个W的数值越大,下次博弈的收益对现在越不重要,所以也称为近利诱惑率。

 

触发策略能够阻止背叛,是因为背叛比起合作,额外得到的好处T-R,小于以后从此对抗的损失(R-P)/(1+W) + (R-P)/(1+W)2 + (R-P)/(1+W)3+ (R-P)/(1+W)4 + … = (R-P)/W,即T-R < (R-P)/W 

推得W < (R-P)/(T-R)。当这个不等式不能保持时,这就无法阻止自私的人们急功近利了。

 

TFT触发策略,除了对背叛报复外,比冷酷策略来得宽容。惩罚过后,当对方回归合作时也报以合作。但这互利的宽容有可能被反复无常的小人利用,时叛时和,从中牟取好处,为了阻止这种反复无常的行为,背叛得到的好处T-R必须小于下一次博弈时得到惩罚的损失R-S

这就有 T-R <(R-S)/(1+W),推出 W < (2R -S-T)/(T-R)。只有这个不等式成立时,TFT策略才能导致稳定的合作。

 

         $W < (R-P)/(T-R)$              1       触发策略能阻止背叛的条件

         $W < (2R-S-T)/(T-R)$     2       TFT能阻止反复无常的条件

 

这两个不等式是重复囚徒困境博弈能够保持合作的关键。这和博弈的局势和博弈人的处境都相关。当博弈中背叛比合作的好处T-R很大,合作与和互斗相差R-P不多,或受惩罚时损失R-S不大时,合作就容易瓦解。当局中人在近利诱惑W较大的处境时合作也不容易维持。

 

近利诱惑率W是由两个因素来决定的:一是下次还会相遇博弈的概率p,下一次见面的机会不大,急功近利做一锤子买卖的人就多;另一个是现在的收益放到下一次的利息r,利息越大,贪图眼前好处的就越多,这两个因子把下一次可能的博弈收益V折现为Vp/(1+r),由W的定义不难推出:

$W = (1+r)/p – 1$         3近利诱惑率与眼前收益的效益及再次博弈机会的关系

 

在高速发展的转型期,新技术、新行业、新政策、新职位、新机遇很多,这意味着背离原来旧的合作关系有着很大的T-R收益。这让敢于突破旧思维,捕抓新机会的人脱颖而出,也让不守规矩,急功近利的人获得成功。这时许多博弈的局势恶化比较不利于合作。另一方面,迅速成功的获利者,其新获得的经济和权位上的资本,能在这充满机遇的时期能产生更大的后续效益,即利息r或者说眼前收益的效益很大。而且这迅速成功拉开经济或职位上的差距,使得下一次与同一个人再次博弈的概率p减小。这时期人员流动率高,也使得与同一个人再次博弈的可能性p减小。所以在高速发展的转型期近利诱惑率W很大。很大的近利诱惑率和恶化的竞争环境造成了人们急功近利,所以这时期社会道德沦丧,老实人吃亏,小人得意,很多人无论出自贪婪还是自保,纷纷叛离社会合作现象。

 

这三个关系式从微观机制上揭示出社会环境和社会现象之间的连系。制定政策者可以从中找出改变乱像的有效措施,个人也可由此知道趋避。这进一步的细节,也是个很好的应用博弈理论的课题,我就不在此详述了。

 

博弈的理论是用微观机制研究群体、社会宏观现象的数学工具。从理性经济人(有头脑的唯利是图者)的假设开始,研究他们间博弈的均衡。在现实中,生存竞争的淘汰会在竞技场上抹去不明智的失败者,所以群体众多的博弈,在时间的作用下会消除个体间决策的差异,得出由大多数理性经济人最佳选择产生的宏观规律。

 

是不是在这恶劣竞争环境和很高的近利诱惑力下,人人都必然沦落才得以生存?也不尽然。虽然这个诱惑很大,也能在相当长的时间内获得利益,造成社会群体道德的沦丧。但不少的人还是有着底线,有所为有所不为,君子爱财取之有道。博弈者的眼界、格局、气度和目标,决定了他所构造的博弈模型。这就有着不同目标、范围和时间长度。道德的底线经过历史长河的洗涤,流传至今,仍在人们思考和计算的盲区里闪烁着益人的智慧。焉知追求那些短视的成功都能够幸福?焉知那些成功者现在的作为,不会成为今后不利的原因?后面的章节会给读者更多的思考。

 

子曰:“不仁者不可以久处约,不可以长处乐。仁者安仁,知者利仁。”

 

(待续)

 



http://blog.sciencenet.cn/blog-826653-678745.html

上一篇:从自私走向合作——4宽容比冷酷好
下一篇:从自私走向合作——6善良的回报

11 李伟钢 张云 丁大勇 黄晓磊 徐晓 陈冬生 李云杰 何巧巧 dating sowhathen yueliang002

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-11-29 16:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部