第五章 模型和训练 | 强化学习模型

第五章 模型和训练 1、强化学习模型 强化学习(Reinforcement Learning)是让计算机实现在特定的情况下,通过不断地尝试,从错误中学习,最后找到规律,找到可以获得最大回报的行为。强化学习有四个基本组件,包括输入:环境(States),动作(Actions),回报(Rewards)以及输出:方案(Policy)。和监督学习不同,强化学习没有确定的标签,需要机器自己摸索,每一个动作对
相关文章
相关标签/搜索