强化学习笔记(1):Q-Learning

1. 强化学习基本概念 考虑下面这个例子:假如我们想让一只老鼠学会走迷宫,往往会在迷宫的几个关键地点放上奶酪,老鼠每次走到关键点就会获得奖励,久而久之,老鼠就能学会快速找到迷宫出口,这就是强化学习的一个例子。 强化学习的关键要素包括:环境(environment),回报(reward),动作(action),状态(state) 。在上述例子中,environment就是老鼠所处的迷宫,迷宫中的奶酪
相关文章
相关标签/搜索