漫谈深度强化学习之手写Deep Q-Network解决迷宫问题

                1. Q-Learning回顾 上一期我们讲了Q-Learning以及Sarsa的算法流程,同时我们还手写了基于Q-Learning以及Sarsa来解决OpenAI gym中的FrozenLake问题。今天,我们将借助神经网络来重新解决这个问题。(FrozenLake问题简单来说就是走迷宫,走错了将不会有任何奖励,走到了目标位置就会获得1的奖励。关于FrozenLa
相关文章
相关标签/搜索