强化学习——从Q-Learning到DQN到底发生了什么？

时间 2021-01-15

原文原文链接

1 学习目标 1. 复习Q-Learning； 2. 理解什么是值函数近似（Function Approximation）； 3. 理解什么是DQN，弄清它和Q-Learning的区别是什么。 2 用Q-Learning解决经典迷宫问题现有一个5房间的房子，如图1所示，房间与房间之间通过门连接，编号0到4,5号是房子外边，即我们的终点。我们将agent随机放在任一房间内，每打开一个房门返回一个r