|
题目: 强化学习AC算法的介绍
主讲人:王婷
地点:腾讯会议
时间:2022/6/28 晚8点30分
简介:1)Model based 和Model free的介绍。
2)AC算法的介绍。
参考文献:
(1)Bahdanau D, Brakel P, Xu K, et al. An actor-critic algorithm for sequence prediction[J]. 2016.
(2)Qiu S, Yang Z, Ye J, et al. On finite-time convergence of actor-critic algorithm[J]. 2021.(3)https://blog.csdn.net/weixin_42301220/article/details/123923078
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 07:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社