一文读懂深度强化学习算法 A3C （Actor-Critic Algorithm）

时间 2021-01-02

原文原文链接

一文读懂深度强化学习算法 A3C （Actor-Critic Algorithm）　　对于 A3C 算法感觉自己总是一知半解，现将其梳理一下，记录在此，也给想学习的小伙伴一个参考。　　想要认识清楚这个算法，需要对 DRL 的算法有比较深刻的了解，推荐大家先了解下 Deep Q-learning 和 Policy Gradient 算法。　　我们知道，DRL 算法大致可以分为如下这几个类