【RL】强化学习的基本思想

在机器学习中,有监督学习和无监督学习的特点是基于已有的数据,去学习数据的分布或蕴含的其他重要信息。强化学习与上述这二者最显著的不同在于,首先它不是基于已有的数据进行学习,而是针对一个环境进行学习;另外,它的目标不是学习数据中蕴含的信息,而是寻找能够在环境中取得更多奖励的方法。通俗地说,监督学习的目标只是“弄清楚环境是什么样的”,而强化学习的目标是“在这个环境中生活得更好”。上述的特点导致了强化学习
相关文章
相关标签/搜索