深度强化学习笔记——基本方法分类与一般思路

概要 本文梳理了一下台大李宏毅老师的深度强化学习系列课程内容。该课程主要是对无模型深度强化学习方法的一些大致介绍,将其分为大致三类:基于值函数的、基于梯度的方法、actor-critic的方法。(其他方法还有模仿学习imitation learning与逆强化学习inverse reinforcement learning) 分类方法可以见下图: 本文对三大类方法的基本思路进行阐述,为了写作的方便
相关文章
相关标签/搜索