yanjiaan的个人博客分享 http://blog.sciencenet.cn/u/yanjiaan

博文

我们身边的博弈问题

已有 12330 次阅读 2018-12-25 11:18 |系统分类:科普集锦

“博弈”一词源于中国古代游戏,如下棋和打牌。我们这里所谓的博弈,是指在遵守一定“游戏规则”前提下,参与者具有竞争或对抗性的行为。为了保障各自利益,参与方需要作一些决策,而这些决策的实际效果依赖于其他各方采取的决策。因此,2005年诺贝尔经济学奖得主奥马把博弈论界定为“交互的决策理论”。寻找对自己最有利的决策,是博弈论的研究对象。

关于博弈问题,《史记》中记载的战国时期“田忌赛马”故事是众所皆知的。当时齐王与大将田忌赛马,孙膑田忌出了一个主意先用下等马来齐王的上等马对决,然后分别用上等马和中等马对齐王的中等马和下等马。结果是:田忌输了第一场,但赢了后两场。这是一个用博弈思想以弱胜强的典型例子。当然,如果预先规定了双方的马必须分别按“上、中、下”等级对决,那孙膑的策略就是一种违规的欺骗行为在上述例子中,前提条件是没有这一竞赛规则。

博弈论真正成为一个理论要追溯到1928年,当年冯·诺伊曼在德国《数学年刊》上发表一篇 “社会博弈理论”的论文,奠定了博弈论的数学基础。1944年冯·诺伊曼跟摩根斯特恩合写了一本书,叫《博弈论与经济行为》,创立了博弈论这门现代数学分支。

博弈可分为合作博弈和非合作博弈。所谓合作博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟各方有利;而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。关于非合作博弈,这里要特别提到一个人,他就是美国电影《美丽的心灵》的主人公纳什。他发表的两篇有关论文给出了所谓的均衡解(称为“纳什均衡”),这是一个稳定的策略组合,每个参与者如果单独改变策略不会比现在的选择更好,而是可能变坏。因此达到纳什均衡后,参与方都不会主动改变策略。 纳什由于对博弈论的杰出贡献获得1994年诺贝尔经济学奖

博弈论的应用非常广泛,在经济学、管理学、社会学等均有应用。诺贝尔经济学奖得主萨谬尔森认为:要想成为现代社会中有文化的人,必须对博弈论有所了解。文就是通过我们身边的若干例子,介绍一些博弈论知识。  

第一个例子,是从博弈论观点看商业营销。我们经常看到某些垄断行业为了追求利润而结成一个联盟,不允许降价促销。但总有一些商家试图把自己产品卖得更快些,偷偷降价促销,所以这个联盟是不牢固的,这种现象与博弈论里有名的“囚徒困境”问题类似。“囚徒困境”是这样表述的:假定有两个小偷被抓住了,如果他们都不坦白也不揭发对方,有可能得到最轻的处罚;如果有一人坦白,另一人不坦白,那么坦白者可以获得较轻的处罚,不坦白者就要加重处罚。 在没有事先同谋情况下,最优策略是二者都坦白揭发对方。这就是非合作博弈的“纳什均衡”,它是各自最优策略,但并不是总体最优的总体最优策略是各自都不坦白也不揭发对方,但这种策略组合是不稳固的,就如同上面所说的“价格联盟”

第二个例子,是为什么现实中“搭便车”现象不可避免。这首先要从博弈论中著名的“智猪博弈”故事说起。该故事有多种版本,其大意是说:在一个猪圈里,有一头大猪和一头小猪,猪圈一端有个踏板,需要多次费力踩踏板,猪圈另一端才会落下一些食物。如果小猪去踩踏板,大猪会在小猪跑到食槽之前就吃完落下的9成食物,而小猪只能得到1成食物;如果是大猪踩踏板,则小猪能吃到3成落下的食物,大猪吃到其余的7成食物。假定踩踏板要消耗相当于2成食物转化的体能,两只猪各自会采取什么策略?在这种情况下,对小猪而言,等待大猪去踩踏板是最优策略,这就是所谓的“搭便车”策略。对大猪而言,由于知道小猪的等待是最优策略,不得不去踩踏板,这是它唯一选择,否则它也要和小猪一样挨饿。所以最终小猪搭了便车,可以不劳而获。在现实社会生活中,就有偷奸取巧的人,他们从生活经验的积累中无意识地就学会了“搭便车”策略。因此,就会经常出现能者多劳、强者多尽义务和“鞭打快牛”的现象。从博弈论观点来看,搭便车现象是不可避免的。

第三个例子,在战场上面临敌机轰炸,是否躲在最好的掩体里就最安全?不一定,因为敌人如果知道你是躲在好的掩体里,他就可以对这一掩体集中轰炸。明智的策略是以某种概率随机选取不同的掩体,让敌人不知道你躲在哪个地方,这就是博弈论里所谓的“概率策略”(或混合策略)。

第四个例子,是如何在一合作联盟中合理分配各个成员的收益。问题归结为如何计算成员对公司的贡献大小。 沙普利建立了一个数学模型,可以计算每个成员在一合作联盟里的贡献大小,就是计算沙普利值。沙普利是博弈论专家,2012年获诺贝尔经济学奖。沙普利值是对边际贡献的加权平均,满足如下几条公理:1)若某参者的所有边际贡献为零,则分配给他的收益也为零;2)参者分配的收益之和等于联盟的总收益 3)若两个参与者在联盟中地位相同,则分配给他们的收益也相同;4)如果联盟有两个博弈,参者分别在两个联盟中分配的收益之和等于在合成博弈中的收益。 沙普利证明了一个定理:沙普利值是唯一满足上述公理的分配方案。

沙普利值的计算可以应用到如何评估投票规则中的权力分配问题。例如,联合国安理会由5个常任理事国和10个非常任理事国组成,提案仅当全部常任理事国和至少4个非常任理事国赞成时方可通过。在这个规则下,常任理事国有一票否决权。计算沙普利值,每个常任理事的权力是0.196,每个非常任理事的权力只有0.002。如果规则修改为提案仅当全部常任理事国和至少7个非常任理事国赞成时方可通过,则每个常任理事的权力降为0.170,每个非常任理事的权力上升为0.015。

博弈问题在日常生活中也是经常会遇到。例如,求职者和用人单位之间就有一种博弈,用人单位想通过面试了解求职者的实际能力,求职者则尽量包装自己,同时隐藏自己的弱点。又如,企业逃税现象相当普遍,在税务机关和纳税企业之间存在博弈。博弈论可以帮助税务机关确定对逃税企业的最佳处罚力度和稽查频率。

 恰当地从博弈论观点去分析社会和经济学问题是应该受到鼓励的,但要防止对博弈论肤浅借用、误用甚至滥用。

 

注:本文是在笔者的《数斋随想》(科学出版社,2016)书中一篇同名文章改写而成的。

 




https://blog.sciencenet.cn/blog-3322199-1153438.html

上一篇:解铃还须系铃人
下一篇:概率破玄机,统计解迷离
收藏 IP: 124.16.148.*| 热度|

20 曾玉亮 鲍海飞 高峡 刘克 刘鹏飞 刘玉胜 黄永义 刘全慧 杨正瓴 陈楷翰 郭景涛 周忠浩 黄永义 程代展 梁进 闫理坦 邱敦莲 liyou1983 hmaoi zjzhaokeqin

该博文允许注册用户评论 请点击登录 评论 (10 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 04:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部