漫谈深度强化学习之手写Deep Q-Network解决迷宫问题

时间 2021-01-15

原文原文链接

1. Q-Learning回顾上一期我们讲了Q-Learning以及Sarsa的算法流程，同时我们还手写了基于Q-Learning以及Sarsa来解决OpenAI gym中的FrozenLake问题。今天，我们将借助神经网络来重新解决这个问题。（FrozenLake问题简单来说就是走迷宫，走错了将不会有任何奖励，走到了目标位置就会获得1的奖励。关于FrozenLa