强化学习概念理解

一、基本理解 强化学习是智能体(Agent)以“试错”的 方式进行学习,通过与环境进行交互获得的奖励指导行为,目标是使智能体获得最大的 奖励。 所谓强化学习,是指从环境状态到行为映 射的学习,以使系统行为从环境中获得的累积Reward(奖励值)最大。 在强化学习中,算法来把外界环境转化为最大化奖励量的方式的动作,算法并没有 直接告诉Agent(行为主体)要做什么或者要采取哪个动作,而是Agent通
相关文章
相关标签/搜索