notes2-- 深度强化学习入门到熟练(Shusen Wang)

Value-based Learning 价值学习 回顾 Deep Q network (DQN) 使用神经网络近似 Q ∗ Q^{*} Q∗ 函数 Approximate the Q Funcition DQN in Super Mario Temporal difference(TD) TD learning for DQN Summary
相关文章
相关标签/搜索