深度强化学习——Dueling-DDQN

http://www.javashuo.com/article/p-gjdrvhaf-nn.html 深度双Q网络(DDQN)和基于竞争构架Q网络(Dueling-DQN)都是DQN的改进版本,前者是对DQN训练算法的改进,后者是对DQN模型结构的改进。 一、DDQN 论文(Hasselt等人)发现并证明了传统的DQN普遍会过高估计Action的Q值,而且估计误差会随Action的个数增加而增加。
相关文章
相关标签/搜索