深度学习(四十)——深度强化学习(3)Deep Q-learning Network(2), DQN进化史

Deep Q-learning Network(续) Nature DQN DQN最早发表于NIPS 2013,该版本的DQN,也被称为NIPS DQN。NIPS DQN除了提出DQN的基本概念之外,还使用了《机器学习(三十三)》中提到的Experience Replay技术。 2015年初,Deepmind在Nature上提出了改进版本,是为Nature DQN。它改进了Loss函数: L =
相关文章
相关标签/搜索