科技导报分享 http://blog.sciencenet.cn/u/kejidaobao

博文

围棋人工智能AlphaGo系列算法的原理与方法

已有 947 次阅读 2023-5-16 09:08 |系统分类:论文交流

围棋人工智能AlphaGo系列算法的原理与方法

章胜1,龙强2*,孔轶男3,王宇2

1. 中国空气动力研究与发展中心空天技术研究所,绵阳621000

2. 西南科技大学计算机学院,绵阳621000

3. 中国空气动力研究与发展中心计算空气动力研究所,绵阳621000

摘要 围棋人工智能AlphaGo系列算法不仅成功地求解了以围棋为代表的完全信息博弈问题,而且具有更加广泛的适用性。依算法的发展历程,从基本原理与技术特征方面对Alpha⁃Go Fan到MuZero的一系列算法进行了梳理,说明了AlphaGo系列算法的落子原理,阐释与对比了其中采用的关键技术:蒙特卡洛树搜索和深度神经网络的建模及训练。AlphaGo系列算法对解决实践中的其他重要问题,从算法设计、神经网络建模到模型利用等方面都具有重要的参考意义。

关键词 人工智能;AlphaGo系列算法;蒙特卡洛树搜索;深度神经网络;强化学习

(责任编辑  刘志远)

http://www.kjdb.org/CN/Y2023/V41/I7/79



https://blog.sciencenet.cn/blog-336909-1388185.html

上一篇:新形势下科技社团在科技伦理治理中的作用
下一篇:美国高性能计算计划的演进逻辑、管理机制与实施特点
收藏 IP: 219.142.112.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-28 19:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部