【转载】David Silver公开课3——动态规划解决MDP的Planning问题

本文是David Silver强化学习公开课第三课的总结笔记。主要谈到了动态规划能够解决MDP的什么问题,能通过Policy Iteration和Value Iteration来解决,这两者指的是什么,出于什么样的考虑提出这两种思路,具体解决步骤是什么。 【转载自】chenrudan.github.io 本文是David Silver强化学习公开课第三课的总结笔记。主要谈到了动态规划能够解决MDP
相关文章
相关标签/搜索