DQN学习笔记

参考:1.莫烦什么是DQN    2强化学习:DQN与Double DQN讨论    3实战深度强化学习DQN-理论和实践 DQN(深度神经网络)是Q learning 与神经网络结合的产物。 1.传统的Q learning 先回顾一下传统的Q learning 算法。   Q learning 是异策略时间差分算法: Q learning最重要的两个概念是异策略和时间差分。   异策略是指动作策
相关文章
相关标签/搜索