DQN解决cartpole原理

时间 2021-01-07

原文原文链接

标签（）：机器学习文章目录 @[toc] 为什么需要DQN DQN与Q学习？ DQN算法更新附录（莫凡代码）当学习状态空间很大，例如围棋的学习中，由于状态空间过大导致Q表远远超过内存，所以在复杂学习情况下Q表更新并不适用。取而代之的是用神经网络当做Q表使用，第一种神经网络是输入状态和动作，输出动作的评价值，第二种神经网络是输入状态输出所有动作和该动作的评价值，再从中选取评价高的动作进行决

>>阅读原文<<

1. DQN 原理（二）：理解 DQN 中的“Q”
2. DQN起源，原理，核心理解
3. 强化学习入门——使用DQN训练CartPole
4. Deep Q Network(DQN)原理解析
5. 理解DQN算法
6. DQN通俗理解
7. DRL---------DQN详解
8. 强化学习—DQN算法原理详解
9. Double DQN and Dueling DQN
10. Nature DQN与Double DQN
更多相关文章...
• SVN 解决冲突 - SVN 教程
• MyBatis的工作原理 - MyBatis教程
• ☆技术问答集锦（13）Java Instrument原理
• Java Agent入门实战（三）-JVM Attach原理与使用