|
围棋人工智能AlphaGo系列算法的原理与方法
章胜1,龙强2*,孔轶男3,王宇2
1. 中国空气动力研究与发展中心空天技术研究所,绵阳621000
2. 西南科技大学计算机学院,绵阳621000
3. 中国空气动力研究与发展中心计算空气动力研究所,绵阳621000
摘要 围棋人工智能AlphaGo系列算法不仅成功地求解了以围棋为代表的完全信息博弈问题,而且具有更加广泛的适用性。依算法的发展历程,从基本原理与技术特征方面对Alpha⁃Go Fan到MuZero的一系列算法进行了梳理,说明了AlphaGo系列算法的落子原理,阐释与对比了其中采用的关键技术:蒙特卡洛树搜索和深度神经网络的建模及训练。AlphaGo系列算法对解决实践中的其他重要问题,从算法设计、神经网络建模到模型利用等方面都具有重要的参考意义。
关键词 人工智能;AlphaGo系列算法;蒙特卡洛树搜索;深度神经网络;强化学习
(责任编辑 刘志远)
http://www.kjdb.org/CN/Y2023/V41/I7/79
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-28 19:23
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社