DQN三大改进(三)-Dueling Network

1、Dueling Network 什么是Dueling Deep Q Network呢?看下面的图片 上面是我们传统的DQN,下面是我们的Dueling DQN。在原始的DQN中,神经网络直接输出的是每种动作的 Q值, 而 Dueling DQN 每个动作的 Q值 是有下面的公式确定的: 它分成了这个 state 的值, 加上每个动作在这个 state 上的 advantage。我们通过下面这张
相关文章
相关标签/搜索