强化学习总结01 基本概念

1. 概述 强化学习是智能体(Agent)与环境(Environment)不断交互, 不断提高自己的决策能力的过程. 面向智能体的学习——通过与环境进行交互 所学习的「样本」来自于「与环境的交互」。而非像传统机器学习的样本是现有的。 通过「试错和优化」进行学习——用试错后的奖励(或惩罚) 来学习 「总体过程」:环境(Environment)会给智能体(Agent)一个观测值(Observation
相关文章
相关标签/搜索