强化学习基础知识

强化学习基础知识 1. 概念 强化学习四要素:状态(state)、动作(action)、策略(policy)、奖励(reward)。 强化学习就是考虑的是智能体(Agent)与环境(Environment)的交互问题: 这里是引用智能体处在一个环境中,每个状态为智能体对当前环境的感知;智能体只能通过动作来影响环境,当智能体执行一个动作后,会使得环境按某种概率转移到另一个状态;同时,环境会根据潜在的
相关文章
相关标签/搜索