|
第二轮人机大战AlphaGo2.0毫无悬念地战胜了柯洁。人类棋手哀鸿片野。以聂棋圣为代表,称AlphaGo2.0可以有20段(人类棋手的最高段位是9段)。但是,职业棋手有一个共识,就是AlphaGo的后半盘比前半盘差距甚大。典型的表现是在官子阶段不断退让,当然退让的条件是最终胜负不变。这种表现在技术上被解释为:AlphaGo的目标函数是赢棋的最大概率,而非最大的赢棋目数。所以,在官子时候,人类棋手认为明显便宜的招数如果被AlphaGo判定为赢棋概率是0.9,而另外一招相对损的招数赢棋概率0.91,那么AlphaGo就采取暂时亏损的招数。如果这个技术解释是对的话,那么,人类棋手还是有可能战胜AlphaGo的。
当然,上述的结论是有条件的:1、AlphaGo那些损招的赢棋概率不是100%! 2、AlphaGo判定赢棋的概率是准确的。基于这两个条件,那么,人类棋手是有可能战胜AlphaGo的。理由如下:
我们先粗浅地理解一下赢棋概率100%是什么概念?这里,显然需要频率派的概率解读。大致地理解,在剩余的所有可能分支中,没有一条是可以导致输棋的路径。这就是100%赢棋概率的粗略理解。反之,假如赢棋概率是0.9,那么意味着10盘棋有9盘是赢棋。赢棋概率是0.91意味着100盘棋有91盘是赢棋,而有9盘是输棋!所以,只要上面两个条件是成立的,那么,理论上,人类棋手能够摸到那10盘中的1盘或者100盘中的9盘,还是可以战胜AlphaGo的。从赢棋的意义上来讲,AlphaGo的策略无疑是正确的,因为它缩小了人类棋手赢棋的可能:0.9 vs 0.91。关键是人类棋手是否有可能永远摸不到那几盘赢棋?如果是序盘或者中盘,也许是对的。但是,到了终盘收官阶段,哪怕是AlphaGo赢棋的概率是0.99,人类棋手还是有可能找到赢棋的那一盘的,因为理论上讲,收官时,棋盘是越来越小的。
另外,从计算技术上讲,计算概率一定是一个浮点数。所以,收官阶段,一旦出现0.9和0.90001的赢棋概率,AlphaGo的选择一定是后者,而实际上,如果后者的官子亏损巨大(例如说导致只赢半目),那么,只要这个赢半目的概率不是100%,那么人类棋手是有可能赢棋的。
那么我们再来估算一下,0.90001的赢棋概率在棋盘缩小到怎样的大小时,人类棋手是有可能掌控得了那余下的0.09999?大概是100000盘中的9999盘。理论上,棋盘上还剩16个合法落子的地方时,最多有65536盘不同的棋。但是,实际上,250手以后,棋盘上有效的可能落子的地方可能对人类棋手来说,也许是可以看得清的咧。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 23:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社