深度强化学习——Dueling-DDQN

时间 2021-01-01

原文原文链接

http://www.javashuo.com/article/p-gjdrvhaf-nn.html 深度双Q网络（DDQN）和基于竞争构架Q网络（Dueling-DQN）都是DQN的改进版本，前者是对DQN训练算法的改进，后者是对DQN模型结构的改进。一、DDQN 论文（Hasselt等人）发现并证明了传统的DQN普遍会过高估计Action的Q值，而且估计误差会随Action的个数增加而增加。