|
题目:用于深度强化学习的决斗网络架构
主讲人:李桂云
时间:2020年12月8日下午4:30-5:30
地点:大理大学古城校区,工程学院409
简介:1)无模型强化学习的神经网络结构
2)决斗网络中的两个独立估计量:状态值函数的估计量和依赖状态的行动优势函数的估计量
参考资料:周志华-机器学习
强化学习 Reinforcement Learning (莫烦 Python 教程)
Playing Atari with Deep Reinforcement Learning
Deep Reinforcement Learning with Double Q-learning
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 09:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社