zhouchichun的个人博客分享 http://blog.sciencenet.cn/u/zhouchichun

博文

题目: 强化学习AC算法的介绍 主讲人:王婷

已有 1262 次阅读 2022-6-28 20:19 |系统分类:科研笔记

题目: 强化学习AC算法的介绍

主讲人:王婷

地点:腾讯会议

时间:2022/6/28 晚8点30分

简介:1)Model based 和Model free的介绍。

2)AC算法的介绍。


参考文献:

(1)Bahdanau D, Brakel P, Xu K, et al. An actor-critic algorithm for sequence prediction[J]. 2016.

(2)Qiu S, Yang Z, Ye J, et al. On finite-time convergence of actor-critic algorithm[J]. 2021.(3)https://blog.csdn.net/weixin_42301220/article/details/123923078




https://blog.sciencenet.cn/blog-3453120-1344992.html

上一篇:题目:使用图神经网络进行异常检测的背景介绍 【秦晨鑫】
下一篇:题目:机器学习量化热力学时间箭头 报告人:雷海鹏
收藏 IP: 39.128.57.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 16:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部