强化学习(一):简介

什么是强化学习 强化学习是想让一个智能体(agent)在不同的环境状态(state)下,学会选择那个使得奖赏(reward)最大的动作(action)。 上图即是一个强化学习的示意图。Agent可以看作是一个机器人,这个机器人在t时刻,通过观测(例如通过各种sensors来观测世界)环境得到agent自己所在的state(状态),接下来agent根据policy(策略)进行一些运算(思考,决策)之
相关文章
相关标签/搜索