强化学习(一):简介

什么是强化学习 强化学习是想让一个智能体(agent)在不一样的环境状态(state)下,学会选择那个使得奖赏(reward)最大的动做(action)。web 上图便是一个强化学习的示意图。Agent能够看做是一个机器人,这个机器人在t时刻,经过观测(例如经过各类sensors来观测世界)环境获得agent本身所在的state(状态),接下来agent根据policy(策略)进行一些运算(思考,
相关文章
相关标签/搜索