强化学习——从Q-Learning到DQN到底发生了什么?

1 学习目标 1. 复习Q-Learning; 2. 理解什么是值函数近似(Function Approximation); 3. 理解什么是DQN,弄清它和Q-Learning的区别是什么。 2 用Q-Learning解决经典迷宫问题 现有一个5房间的房子,如图1所示,房间与房间之间通过门连接,编号0到4,5号是房子外边,即我们的终点。我们将agent随机放在任一房间内,每打开一个房门返回一个r
相关文章
相关标签/搜索