强化学习(一) - 基础认知

强化学习 - 基础认知 强化学习是想让一个智能体(agent)在不一样的环境状态(state)下,学会选择那个使得奖赏(reward)最大的动做(action)。html Agent在 t 时刻,经过观测环境获得本身所在的 状态(state),接下来agent根据 策略(policy) 进行决策后,作出一个 动做(action)。这个action就会使得agent在 环境(environment)
相关文章
相关标签/搜索