notes2-- 深度强化学习入门到熟练（Shusen Wang）

时间 2021-01-16

标签 DRL 繁體版

原文原文链接

Value-based Learning 价值学习回顾 Deep Q network (DQN) 使用神经网络近似 Q ∗ Q^{*} Q∗ 函数 Approximate the Q Funcition DQN in Super Mario Temporal difference(TD) TD learning for DQN Summary

>>阅读原文<<

最新文章

欢迎关注本站公众号,获取更多信息