DQN

时间 2021-01-07

原文原文链接

文章目录神经网络的作用更新神经网络 Experience replay 和 Fixed Q-targets 神经网络的作用将状态和动作当成神经网络的输入, 然后经过神经网络分析后得到动作的 Q 值, 这样我们就没必要在表格中记录 Q 值。而是直接使用神经网络生成 Q 值. 也能只输入状态值, 输出所有的动作值, 然后按照 Q learning 的原则, 直接选择拥有最大值的动作当做下一步要做

>>阅读原文<<

1. Double DQN and Dueling DQN
2. Nature DQN与Double DQN
3. 6.DQN(Deep Q-Network)+Double DQN+Dueling DQN
4. DQN
5. Prioritized Replay DQN与Dueling DQN
6. GAN-DQN
7. Prioritized DQN
8. Noisy DQN
9. Double DQN
10. DQN 原理（二）：理解 DQN 中的“Q”
更多相关文章...