DeepMind Nando(原牛津大学教授)强化学习最新进展,含图文、公式和代码,附102页PPT下载...

点击上方“AI遇见机器学习”,选择“星标”公众号 重磅干货,第一时间送 转自:专知 【导读】在DeepMing任职的Nando de Freitas(原牛津大学教授)在KHIPU 2019上做了关于强化学习(RL)的教程,102页ppt。涵盖了强化学习RL基础概念、策略梯度、动态规划以及D4PG、R2D3等RL算法,并介绍了RL的应用。 在KHIPU 2019(Latin American Mee
相关文章
相关标签/搜索