1 强化学习(Reinforcement Learning, RL)初步介绍

【下一篇 2 从Multi-arm Bandits问题分析 - RL进阶 】html 当前的机器学习算法能够分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Learning),结构图以下所示:web 其余许多机器学习算法中学习器都是学习怎样作,而RL是在尝试的过程当中学习在特定的情境
相关文章
相关标签/搜索