强化学习总结01 基本概念

时间 2021-01-15

标签 Reinforcement Learning 繁體版

原文原文链接

1. 概述强化学习是智能体（Agent）与环境（Environment）不断交互, 不断提高自己的决策能力的过程. 面向智能体的学习——通过与环境进行交互所学习的「样本」来自于「与环境的交互」。而非像传统机器学习的样本是现有的。通过「试错和优化」进行学习——用试错后的奖励（或惩罚）来学习「总体过程」：环境（Environment）会给智能体（Agent）一个观测值（Observation

>>阅读原文<<