强化学习（Reinforcement Learning, RL）初步介绍

时间 2021-01-02

原文原文链接

下一篇从Multi-arm Bandits问题分析 - RL进阶】　　当前的机器学习算法可以分为3种：有监督的学习（Supervised Learning）、无监督的学习（Unsupervised Learning）和强化学习（Reinforcement Learning），结构图如下所示：　　其他许多机器学习算法中学习器都是学得怎样做，而RL是在尝试的过程中学习到在特定的情境下选择哪