各种DQN

Q-learning     DQN 论文:Human-level control through deep reinforcement learning DQN其实就是将深度学习与Q-learning结合起来了,建立了卷积神经网络来估计Q值。        建立了Q network,Q target network( Q̂  )两个网络,对每一个episode,t时刻时,对于状态 st ,利用
相关文章
相关标签/搜索