|
本篇主要是对这段时间以来我在科学网上发的一些强化学习相关的文章进行一个大汇总。作为对强化学习Tabular方法的一个简单指导性的目录,本篇也会提供之前讨论过的强化学习中的经典问题实现的代码与相关的图表分析的源文件。
K-level
相关文章:
Markov
实例:
1. DP-Programming - Bandit问题
2. DP-Programming - GridWorld
3. Recycling Robot
4. Jack‘s Rental Car
5. Gambler's Problem
相关文章:
Monte Carlo
实例:
1. Soap Bubble
2. Black Jack
3. Infinite Variance
4. Monty Hall Problem
5. Race Track
相关文章:
TD Methods
实例:
1. Cliff GridWorld
2. Random Walk
3. Windy GridWorld
相关文章:
Room Problem & Maze Problem
实例:
1. Room Problem
2. Maze Berrier
3. Dyna-Q
相关文章:
相关实例代码(Matlab):
链接:https://pan.baidu.com/s/176TmqhKAoi_rsrvDB9b91A 密码:6hv5
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 20:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社