博文

围棋人工智能AlphaGo系列算法的原理与方法

已有 947 次阅读 2023-5-16 09:08 |系统分类:论文交流

围棋人工智能AlphaGo系列算法的原理与方法

章胜¹，龙强^2*，孔轶男³，王宇²

1. 中国空气动力研究与发展中心空天技术研究所，绵阳621000

2. 西南科技大学计算机学院，绵阳621000

3. 中国空气动力研究与发展中心计算空气动力研究所，绵阳621000

摘要围棋人工智能AlphaGo系列算法不仅成功地求解了以围棋为代表的完全信息博弈问题，而且具有更加广泛的适用性。依算法的发展历程，从基本原理与技术特征方面对Alpha⁃Go Fan到MuZero的一系列算法进行了梳理，说明了AlphaGo系列算法的落子原理，阐释与对比了其中采用的关键技术：蒙特卡洛树搜索和深度神经网络的建模及训练。AlphaGo系列算法对解决实践中的其他重要问题，从算法设计、神经网络建模到模型利用等方面都具有重要的参考意义。

关键词 人工智能；AlphaGo系列算法；蒙特卡洛树搜索；深度神经网络；强化学习

（责任编辑刘志远）

http://www.kjdb.org/CN/Y2023/V41/I7/79

转载本文请联系原作者获取授权，同时请注明本文来自科技导报科学网博客。
链接地址：https://blog.sciencenet.cn/blog-336909-1388185.html

上一篇：新形势下科技社团在科技伦理治理中的作用
下一篇：美国高性能计算计划的演进逻辑、管理机制与实施特点

收藏 IP: 219.142.112.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

科技导报

扫一扫，分享此博文

科技导报分享 http://blog.sciencenet.cn/u/kejidaobao

博文

围棋人工智能AlphaGo系列算法的原理与方法

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

科技导报

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

科技导报分享 http://blog.sciencenet.cn/u/kejidaobao

博文

围棋人工智能AlphaGo系列算法的原理与方法

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

科技导报

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)