解读continuous control with deep reinforcement learning（DDPG）

时间 2021-01-01

原文原文链接

版权声明：本文为博主原创文章，未经博主允许不得转载。博主：shenshikexmu 联系方式：[email protected] 缘起 DDPG，是Google Deepmind第一篇关于连续动作的深度加强学习论文（是否第一篇存疑）。DQN（Deep Q Network）生成的策略执行的动作是离散或者低维的，虽然在状态输入上可以是高维的观察状态。如在DQN2014中，有效的动作在4到18个之间，

>>阅读原文<<

相关文章

相关标签/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<