强化学习实验

强化学习之Q学习实验描述 一.强化学习简介 强化学习是一类特殊的机器学习算法,它借鉴于行为主义心理学。算法要解决的问题是智能体在环境中怎样执行动作以获得最大的累计奖励。 图1. 强化学习的基本原理 智能体是强化学习中的动作实体,对于自动驾驶的汽车,环境是当前的路况。在每个时刻智能体和环境有自己的状态,如汽车当前位置和速度,路面上的车辆和行人情况。智能体根据当前状态确定一个动作,并执行该动作。之后它
相关文章
相关标签/搜索