强化学习之DQN

参考:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/ DQN的两大特色: Experience replay:经验回放,Q-learning是一种off-policy离线学习方法,可以利用以前的经验进行学习 Fixed Q-targets:打乱相关性,用到两个结构相同,但架构不同的神经网
相关文章
相关标签/搜索