理解DQN算法

时间 2021-01-07

标签 DQN Q Learning 繁體版

原文原文链接

Q-Learning算法 Q-Learning的算法如下：对于Q-Learning，首先就是要确定如何存储Q值，最简单的想法就是用矩阵，一个s一个a对应一个Q值，所以可以把Q值想象为一个很大的表格，横列代表s，纵列代表a，里面的数字代表Q值. 维度灾难在上面的分析中，我们使用表格来表示Q(s,a)，但是这个在现实的很多问题上是几乎不可行的，因为状态实在是太多。使用表格的方式根本存不下。怎么办

>>阅读原文<<

1. DQN算法分析
2. DQN 原理（二）：理解 DQN 中的“Q”
3. DQN通俗理解
4. Reinforcement Learning DQN 算法及 Actor-Critic 算法
5. 强化学习DQN算法
6. 强化学习算法DQN
7. 强化学习——DQN算法
8. 强化学习—DQN算法原理详解
9. 深度强化学习DQN系算法理解
10. DQN解决cartpole原理
更多相关文章...
• MySQL常用运算符详解 - MySQL教程
• PHP 运算符 - PHP教程
• 算法总结-广度优先算法
• 算法总结-深度优先算法