102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

时间 2020-12-24

原文原文链接

来源：专知本文多图，建议阅读9分钟本文提供涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法的资源。 [ 导读 ] 在DeepMing任职的Nando de Freitas（原牛津大学教授）在KHIPU 2019上做了关于强化学习（RL）的教程，102页ppt。涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法，并介绍了RL的应用。在K

>>阅读原文<<