强化学习(Reinforcement Learning, RL)初步介绍

下一篇 从Multi-arm Bandits问题分析 - RL进阶 】   当前的机器学习算法可以分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Learning),结构图如下所示:     其他许多机器学习算法中学习器都是学得怎样做,而RL是在尝试的过程中学习到在特定的情境下选择哪
相关文章
相关标签/搜索