深度强化学习笔记——基本方法分类与一般思路

时间 2021-01-13

标签强化学习繁體版

原文原文链接

概要本文梳理了一下台大李宏毅老师的深度强化学习系列课程内容。该课程主要是对无模型深度强化学习方法的一些大致介绍，将其分为大致三类：基于值函数的、基于梯度的方法、actor-critic的方法。（其他方法还有模仿学习imitation learning与逆强化学习inverse reinforcement learning）分类方法可以见下图：本文对三大类方法的基本思路进行阐述，为了写作的方便

>>阅读原文<<