|||
上面的音乐是来自棋魂的钢琴曲
-------------
前几天看了应行仁老师关于博弈的一系列博文,在“从自私走向合作——6善良的回报”后面留了言:
http://blog.sciencenet.cn/home.php?mod=space&uid=826653&do=blog&id=679411
-------------
[11]张云
例如15个程序14个是邪恶的,剩下的一个TFT应该拿不到总分第一。
博主回复(2013-4-13 01:50):对。下一篇将讨论这个情况。
-------------
后来一想觉得我的想法太极端了,如果15个程序13个是邪恶的,TFT能不能拿到总分第一呢?推了下发现似乎真的可以。无论类似于AllD的邪恶程序有多少,只要有2个TFT,TFT就能拿总分第一。
首先还是引用应老师的定义:
AllD:一律不合作
TFT:第一次合作,以后就照抄上一回合对手的策略。
T>R>P>S,表示收入 | 某人 | ||
合作 | 背叛 | ||
你 | 合作 | R,R | S,T |
背叛 | T,S | P,P |
假设参与游戏的有x个类似于AllD的策略,y个类似于TFT的策略,两两捉对交锋150次:
| AllD | TFT | 总收入 |
AllD | $150P$ | $149P+T$ | |
TFT | $149P+S$ | $150R$ | $(149P+S)x+150R(y-1)$ |
上表的内容其实挺直观的,还是解释一下吧:
AllD会遇到 $x-1$ 次AllD,每次交锋背叛150次,获得150P,共获得150P(x-1)的收入;遇到y次TFT,因为TFT第一次没有背叛,所以AllD获得 149P+T,共获得 (149P+T)y的收入。
TFT会遇到x次AllD,第一次没有背叛,然后背叛149次,获得149P+S,共获得(149P+S)x的收入;遇到 $y-1$ 次TFT,合作150次,获得150R,共获得150R(y-1)的收入;
AllD的总收入为:
$150Px-150P+149Py+Ty =150Px+150P(y-1)+(T-P)y$
TFT的总收入为:
$149Px+Sx+150Ry-150R =150Px+150R(y-1)-(P-S)x$
此时第一项两者相同,
第二项TFT多获得 $150(R-P)(y-1)$ ,
第三项AllD多获得 $(T-P)y+(P-S)x$ ,这与第一次交易相关。
R-P、T-P、P-S是等数量级的,y-1,y,x也是等数量级的。TFT多个150的倍数。(错误!)
如果x=13,y=2,T-P=2(R-P)=2(P-S) ,TFT多获得的钱差不多是AllD的8.8倍。
-------------
当然如果我们忽略掉第一次的情况,过程还可以更简化一点:
AllD | TFT | 总收入 | |
AllD | 149P | 149P | $149P(x-1)+149Py$ |
TFT | 149P | 149R | $149Px+149R(y-1)$ |
很明显: $149(x-1)+149Py=149Px+149P(y-1)$
是小于 $149Px+149R(y-1)$ 的。
-------------
结合应老师的博文,这次计算给我的启示是,
邪恶者的眼中,所有对手都是邪恶的,包括TFT、Grim。而善良者能发现身边的善良者并与之共同获取更大的价值。
或许我们周围有很多邪恶的存在,但是只要有一个善良的存在,我就能和他一起获得比邪恶多得多的利益。当然,我们两个必须使用TFT或Grim一类的策略。
-------------
公式一上一下的显得好不专业,算了,明天再改。
-------------
补充:本文开头的结论“无论类似于AllD的邪恶程序有多少,只要有2个TFT,TFT就能拿总分第一。”是建立在忽略掉第一次交易的条件下的。如果要考虑第一次交易,必须:
${\color{Red} 150(R-P)(y-1)-(T-P)y-(P-S)x>0}$
TFT才能拿总分第一。感谢应老师的指点。
公式中150为交易次数,其实也应该用个变量代替。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-20 17:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社