李宏毅学习笔记23.Deep Reinforcement Learning

时间 2020-12-20

原文原文链接

文章目录前言 Overview概述小栗子 play Go Supervised v.s. Reinforcement 另外一个栗子：玩游戏（Warning of Game）难点小结本节要点 Policy-based Approach: Learning an Actor 步骤一：Neural Network as Actor 步骤二：Goodness of Actor 步骤三：Pick t