DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载...

时间 2020-12-24

原文原文链接

点击上方“AI遇见机器学习”，选择“星标”公众号重磅干货，第一时间送转自：专知【导读】在DeepMing任职的Nando de Freitas（原牛津大学教授）在KHIPU 2019上做了关于强化学习（RL）的教程，102页ppt。涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法，并介绍了RL的应用。在KHIPU 2019（Latin American Mee

>>阅读原文<<