lovesvidon的个人博客分享 http://blog.sciencenet.cn/u/lovesvidon

博文

【RL系列】强化学习基础知识汇总

已有 5270 次阅读 2018-8-18 20:07 |系统分类:科研笔记

本篇主要是对这段时间以来我在科学网上发的一些强化学习相关的文章进行一个大汇总。作为对强化学习Tabular方法的一个简单指导性的目录,本篇也会提供之前讨论过的强化学习中的经典问题实现的代码与相关的图表分析的源文件。


K-level

相关文章:


Markov 

实例:

1. DP-Programming - Bandit问题

2. DP-Programming - GridWorld

3. Recycling Robot

4. Jack‘s Rental Car

5. Gambler's Problem

相关文章:


Monte Carlo

实例:

1. Soap Bubble

2. Black Jack

3. Infinite Variance

4. Monty Hall Problem

5. Race Track

相关文章:


TD Methods

实例:

1. Cliff GridWorld

2. Random Walk

3. Windy GridWorld

相关文章:


Room Problem & Maze Problem

实例:

1. Room Problem

2. Maze Berrier

3. Dyna-Q

相关文章:


相关实例代码(Matlab):

链接:https://pan.baidu.com/s/176TmqhKAoi_rsrvDB9b91A 密码:6hv5



https://blog.sciencenet.cn/blog-3189881-1129931.html

上一篇:【RL系列】Monte Carlo与TD算法的结合,n-step TD算法
下一篇:【ML系列】简单的二元分类——Logistic回归
收藏 IP: 210.45.251.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 20:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部