zhouchichun的个人博客分享 http://blog.sciencenet.cn/u/zhouchichun

博文

用于深度强化学习的决斗网络架构 李桂云

已有 2219 次阅读 2020-12-8 12:49 |系统分类:科研笔记

题目:用于深度强化学习的决斗网络架构

主讲人:李桂云

时间:2020年12月8日下午4:30-5:30

地点:大理大学古城校区,工程学院409

简介:1)无模型强化学习的神经网络结构

      2)决斗网络中的两个独立估计量:状态值函数的估计量和依赖状态的行动优势函数的估计量

 

参考资料:周志华-机器学习

强化学习 Reinforcement Learning (莫烦 Python 教程)

Playing Atari with Deep Reinforcement Learning

Deep Reinforcement Learning with Double Q-learning




https://blog.sciencenet.cn/blog-3453120-1261608.html

上一篇:指纹特征提取的方法研究以及关于CAE在人类指纹提取上应用的研究和讨论
下一篇:513 讨论班 —肺部结节检测及医学图像配准(刘杨)
收藏 IP: 39.129.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-19 22:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部