深度强化学习实战:Tensorflow实现DDPG - PaperWeekly 第48期

作者丨李国豪 学校丨中国科学院大学&上海科技大学 研究方向丨无人驾驶,强化学习 指导老师丨林宝军教授 1. 前言 本文主要讲解 DeepMind 发布在 ICLR 2016 的文章 Continuous control with deep reinforcement learning,时间稍微有点久远,但因为算法经典,还是值得去实现。 2. 环境 这次实验环境是 Openai Gym 的 Pend
相关文章
相关标签/搜索