JavaShuo
栏目
标签
强化学习,深度强化学习
时间 2020-12-27
原文
原文链接
DQN的局限性 Atari 游戏所需的动作是离散的(有时间间隔的输出),相对低维的(只有少数几个动作),而实际的控制问题则是连续的,高维的。DQN无法直接应用到这样的领域,因为连续的值(比如输出一个速度)需要在每一步都作出优化迭代,DQN只是根据动作对Q值做优化。 要直接应用DQN到连续动作领域,最简单的做法就是将连续动作离散化,也就是依然每个时间间隔输出一个动作值,把每个动作也离散化。但这样存
>>阅读原文<<
相关文章
1.
强化学习,深度强化学习
2.
强化学习,深度学习,深度强化学习
3.
深度强化学习——强化学习到深度强化学习
4.
深度强化学习1——强化学习到深度强化学习
5.
深度强化学习——A3C
6.
【深度强化学习】A3C
7.
深度强化学习
8.
深度强化学习——DQN
9.
深度强化学习task03
10.
深度强化学习DQN
更多相关文章...
•
您已经学习了 XML Schema,下一步学习什么呢?
-
XML Schema 教程
•
我们已经学习了 SQL,下一步学习什么呢?
-
SQL 教程
•
Tomcat学习笔记(史上最全tomcat学习笔记)
•
适用于PHP初学者的学习线路和建议
相关标签/搜索
强化学习
强化学习篇
强化
深度学习
0.强化学习导论
强化学习炼金术
强化学习笔记
强化学习(第2版)
深度强化学习入门
化学变化
Hibernate教程
PHP教程
Thymeleaf 教程
学习路线
初学者
代码格式化
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
Mud Puddles ( bfs )
2.
ReSIProcate环境搭建
3.
SNAT(IP段)和配置网络服务、网络会话
4.
第8章 Linux文件类型及查找命令实践
5.
AIO介绍(八)
6.
中年转行互联网,原动力、计划、行动(中)
7.
详解如何让自己的网站/APP/应用支持IPV6访问,从域名解析配置到服务器配置详细步骤完整。
8.
PHP 5 构建系统
9.
不看后悔系列!Rocket MQ 使用排查指南(附网盘链接)
10.
如何简单创建虚拟机(CentoOS 6.10)
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
强化学习,深度强化学习
2.
强化学习,深度学习,深度强化学习
3.
深度强化学习——强化学习到深度强化学习
4.
深度强化学习1——强化学习到深度强化学习
5.
深度强化学习——A3C
6.
【深度强化学习】A3C
7.
深度强化学习
8.
深度强化学习——DQN
9.
深度强化学习task03
10.
深度强化学习DQN
>>更多相关文章<<