Nature DQN与Double DQN

在前面的文章强化学习DQN算法中,介绍了经典的DQN算法,然而DQN也存在一些问题。Nature DQN与Double DQN的提出就是为了解决这些问题,下面笔者将介绍这个两种改进的算法。 Nature DQN算法 Nature DQN的提出是为了提升原版DQN的收敛速度。在原版DQN中,计算目标Q值的公式 如下: 由于在计算目标 值 时,使用的是当前要训练的 网络,而 网络的更新使用的又是目标
相关文章
相关标签/搜索