强化学习——从Q-Learning到DQN到底发生了什么?

1 学习目标 1. 复习Q-Learning;python 2. 理解什么是值函数近似(Function Approximation);web 3. 理解什么是DQN,弄清它和Q-Learning的区别是什么。算法 2 用Q-Learning解决经典迷宫问题 现有一个5房间的房子,如图1所示,房间与房间之间经过门链接,编号0到4,5号是房子外边,即咱们的终点。咱们将agent随机放在任一房间内,每
相关文章
相关标签/搜索