强化学习原理一
强化学习原理,Reinforcement Learning 简称RL。
- 基础工具,Fundamental tools
- 基本的概念 Concepts
- 贝尓曼公式
- 贝尔曼最优公式
- 算法和方法,Algorithms and methods
- 值迭代 value iteration
- 策略迭代 policy iteration
- 蒙特卡洛的方法 Monte Carlo
- 时序差分的方法
- 基于value function approximation
- policy gradient method
- actor-critic method