||
善战者无赫赫之功 善医者无煌煌之名
科普的困难(http://blog.sciencenet.cn/blog-1319915-808203.html)在于没有足够的素材,因为科普的目的在于让普通人理解科学研究的主要精神和基本手段。科学的主要精神和基本手段是非常少的,科普工作者无法靠科普工作谋生。“授人以鱼不如授人以渔”的结果是“教会徒弟,饿死师傅”,太好的科普教育会砸掉工作者的饭碗。这样就造成了现在这样“只传授知识,不谈论方法”的现状,而且,因为机构必须定时定量地发布科技新闻,就只能人为地拔高工作的重要性。
这种说法可能让人觉得很突兀、很古怪,下面举个例子来说明一下。既然是在科学网上讨论这个问题,我们就用科学网置顶的一篇博文为例。
周涛老师刚刚介绍了“博弈论领域正在兴起的革命”[1]:在任何的两人重复博弈中都存在这样一种“零行列式策略”:这类策略强大到无论对方如何抗争如何变化,总能做到比对方更胜一筹;或者能够凭借一己之力,单方面将对手的收益控制在一个固定的数值上。
我们就以这篇博文讨论的问题为例,说明现在科普工作中的一个常见问题,即,宣传时人为地拔高工作的重要性,而且,“只讲结论,不谈方法”。我还想用自己的这篇博文说明,如果科普工作做得简单明快,反而会让读者产生“不过如此而已”的感觉。
周涛的博文应该算是起到了很好的科普作用,不仅体现在该文的推荐人很多、点击数较高而且评论者较多等方面,而且表现在这篇文章引起了好几个人的反驳,至少一个人阅读并思考了相关的具体工作---这个人就是我自己,我刚刚读了周文后面列举的文献[4]和[6](即本文的[2]和[3])。当然也不是没有缺点,具体表现在他介绍了一个非常违反常识的结论,并称之为博弈论领域的革命,但是在有人质疑这个结论的时候,他也只能说去读原文吧。顺便说一下,这也是科普工作很难进行的一个例证:专家由于各种原因并不愿意做科普,结果就只能留给外行来做---比如说,我。
博弈论是用数学工具对权衡判断进行定量分析的理论,其中最著名的例子就是“囚徒悖论”了。
这个悖论有很多中貌似不同的表达方式,为了具体讨论的方便,我们就用PNAS这篇文章[2]里的说法。X和Y面临这样的决断问题:如果他们彼此合作,每个人得到的好处(R)就大一些;如果他们彼此背叛,每个人得到的好处就小一些,或者说受到了惩罚(P);如果一个人选择合作,而另一个人选择背叛对方,那么前者就倒霉了(S),而后者就赚了(T)。不失一般性, T 〉 R 〉 P 〉 S = 0。虽然两个人合作肯定对双方有利(每个人得到R),但是每个人的选择都是背叛对方:如果对方犯傻了选择合作,我就可以得到T;如果对方也同样精明,至少我也能得到P;可是我要犯傻了选择合作,就有可能得到惩罚S。这就是所谓的“纳什均衡”。只要你承认囚徒悖论的这些前提,就得承认你的策略只能是背叛。
当然,这个问题太简单了,而且它的结论也不太积极:如果你是一个理性的人,为了利益就只能选择背叛;而选择背叛的结果使得你丧失了获得更大利益的机会,好像说明你并不是一个理性的人。虽然说博弈论的出发点就是只有利,没有义(或者说,所有的义都可以用利来标价),但是,考虑到几千年来的“义利”之辨,是不是能够改进一些呢?这样就出现了重复博弈的问题。
重复博弈说的是,这两个倒霉蛋不仅要做这个抉择,而且要不停地做同一种抉择,做它无穷遍[4]。在这种情况下,会不会有什么奇迹发生呢?对了,你猜对了,“义”出现了,为了长期的利益,合作是更好的策略。原因也很简单。无论是单次博弈还是重复博弈,实际上都隐藏了一件重要的事情,比博弈本身还重要:除了这两个人以外,还有个外部世界,相对于个人在外部世界的生存来说,两个人的谁赢谁输并不重要,重要的是获得足够的利益使得自己能够在面对外部世界时生存下去。从这个意义上来说,合作这种“义”也就是“利”的一种表现形式而已,跳出了个人的小圈子,可能会有更大的利。“蜗牛角上争何事?”让我们一起来改造世界吧!
动态重复博弈说的是在博弈过程中,参与者可以调整自己的策略。这只是让问题稍微更复杂一点,并没有实质性的影响,我们就不仔细讨论了。
这就是我们大家耳熟能详的囚徒悖论了。这些结论实际上都只是我们的常识,人们已经掌握它们有几千年了。“防人之心不可无”,“合则两利,分则两害”,如此而已,只不过博弈论用些数字把它们包装了一下罢了。
现在,Press 和 Dyson 说---至少从其他人科普他们的研究结果的文章来看---他们发现了一种惊人的策略,用周老师的话来说就是:在任何的两人重复博弈中都存在这样一种“零行列式策略”:这类策略强大到无论对方如何抗争如何变化,总能做到比对方更胜一筹;或者能够凭借一己之力,单方面将对手的收益控制在一个固定的数值上。这种说法确实违反了我们的常识:如果博弈双方都同样理性的话,如果他们具有相同的资源和知识,那么谁也不应该能够占到便宜。仔细地阅读他们的文章[2]就会发现,非同寻常的结论来自于非同寻常的假设:这两个人并不是同样的理性,其中一个人X(我们叫他聪明蛋吧)比对手Y(我们叫他笨蛋好了)更聪明,如此而已。
让我总结一下这种策略的结果:X(聪明蛋)总是能够获得比Y(笨蛋)更大的利益(比如说三倍);X能够单方面决定Y的收益。这个结果给人留下的印象是X具有常胜不败的策略。但实际情况并非如此,因为这两个结果并不能同时实现。
聪明蛋X能够单方面决定笨蛋Y的收益,实际上这并不像初看起来的那么困难。比如说,如果Y虽然是个笨蛋,但他是个好蛋,总是采取合作的态度,那么X当然可以让Y的收益等于从S(因对方背叛而受到惩罚)到R(因对方合作而获益)之间的任何值,只要X根据自己的心愿选择合作的几率就可以了。如果Y不仅是个笨蛋,而且是个坏蛋,总是要背叛,那么X仍然可以让Y的收益等于从P(因双方背叛而获得的收益)到T(因对方犯傻而得到的奖励)之间的任何值,只要自己不怕损失就可以了---只是这时候他看起来不像是个聪明蛋,而是更像雷锋。所以,只要X高兴,他总是可以把对方的收益限定到P和R之间的任何一个值。Press 和 Dyson 的发现的惊人之处(他们发现了所谓的零行列式条件)在于,他们证明了,不仅仅是这两种极端情况,而是在更加宽松的一些条件下,这个结论也可能成立---但是,能够决定对方的收益并不意味着自己会在竞争中获胜,因为自己的收益可能比对方还低,或者是自己有更好的策略得到更大的收益。这个很重要的“但是”并没有在科普文章中体现出来,有意无意地误导了读者认为这是个常胜的策略。
至于聪明蛋X总是能够获得比笨蛋Y更大的利益,这也不奇怪:因为他比对方聪明嘛。这个策略说白了就是放长线钓大鱼,先给笨蛋一点小甜头(在对方背叛的时候也保证一点合作的几率),然后让他吃个大跟头(在对方合作的时候,给他来个更大的背叛几率)。他甚至能够引导Y选择策略,技巧就是选择甜头的大小。这个策略的问题在于有可能吃亏,如果对方是个只啃饵不吞钩的滑头鱼,那就赔掉了---但是根据问题的假设,Y是个笨蛋,他不会想到这个聪明主意的。此外,这个策略也不是最佳策略,只要对方是个笨蛋,X总是有办法能够得到更大的利益。但是,骗子骗得了一时,骗不了一世,一旦笨蛋觉悟了,这个游戏就没法子玩了。
上面说的这些东西都在Press 和 Dyson 的文章里,但是在宣传的时候(这篇文章似乎确实很重要,有很多关于它的报道)却或多或少地忽略掉了。这很可能是为了宣传的目的:你要不说得玄乎点,普通人根本就不会关心啊!
显然,这种策略也能够推广到多人重复博弈[3]中:对于聪明蛋来说,骗一个笨蛋是骗,骗一群笨蛋不也是骗嘛?只不过难度稍微大些罢了。周老师他们还指出了另一种困难,在多人博弈里,也许不止一个聪明蛋,而是有两个三个聪明蛋,这样骗人就更难了。我倒是有个建议,完全可以探讨这样一种策略,让聪明蛋们在重复多人博弈中发现到底有多少个聪明蛋,值不值得想办法让所有聪明蛋团结起来,对笨蛋们来个大杀四方---这样不仅有了剥削,还会产生阶级,也许还能产生整本的资本论呢。
这种研究倒是很新颖,问题在于怎么把对手当傻子看呢?既然是博弈论,就像兵法一样,怎么也应该料敌从宽吧。孙子告诉我们,“兵以正合,以奇胜”,“先为不可胜,以待敌之可胜”,就算是贵州的老虎见了黔之驴,也要先试探试探,发现“技止此耳”后才干事情啊。一方面认识到长期合作才是正道,另一方面又认为对方不够理性,可以趁机占些便宜,怎么说都有点对不起聪明蛋的称号啊。
好了,这样科普好像可以把道理说清楚,但是困难马上就来了:问题虽然讲清楚了,但是神秘感也没有了---聪明蛋总是要占笨蛋的便宜,天经地义嘛,有什么了不起的?“不过如此而已”啊。于是,科学革命不见了,读者也跑掉了,更重要的是,科普工作者也要饿死了。
这就是科普的困难:没有足够的素材,因为科普的目的在于让普通人理解科学研究的主要精神和基本手段;科学的主要精神和基本手段是非常少的,科普工作者无法靠科普工作谋生。
福尔摩斯告诉华生[5],“你知道魔术家一旦把自己的戏法说穿,他就得不到别人的赞赏了;如果把我的工作方法给你讲得太多的话,那么,你就会得出这样的结论:福尔摩斯这个人不过是一个非常平常的人物罢了。”科普工作者也面临着同样的困难。
[1]周涛,零行列式策略:博弈论领域正在兴起的革命
http://blog.sciencenet.cn/blog-3075-808397.html
[2] Press W H and Dyson F J 2012 PNAS 109,10409.
[3] Pan L, Hao D, Rong Z and Zhou T arXiv:1402.3542.
[4]这让我想起了电影《偷天情缘》,其中的主人公到小镇子报道土拨鼠节,没想到自己的生活陷入了死循环:不管他在土拨鼠节这一天做了什么,第二天醒来以后还是发现自己又回到了土拨鼠节,一切都没有改变。
土拨鼠之日 http://movie.douban.com/subject/1300613/
[5] 柯南道尔,《福尔摩斯探案集,血字的研究》
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-20 23:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社