Nature DQN与Double DQN

时间 2021-07-12

原文原文链接

在前面的文章强化学习DQN算法中，介绍了经典的DQN算法，然而DQN也存在一些问题。Nature DQN与Double DQN的提出就是为了解决这些问题，下面笔者将介绍这个两种改进的算法。 Nature DQN算法 Nature DQN的提出是为了提升原版DQN的收敛速度。在原版DQN中，计算目标Q值的公式如下：由于在计算目标值时，使用的是当前要训练的网络，而网络的更新使用的又是目标