强化学习（一）强化学习的基本概念、e贪心算法、Softmax算法

时间 2021-01-15

标签强化学习机器学习人工智能繁體版

原文原文链接

强化学习（reinforcement learning，RL）是机器学习的一个领域，主要通过在环境（environment）中采取动作（action），来最大化某些指标，例如累计奖赏（cumulative reward）的一种学习方法。强化学习、有监督学习（supervised learning）与无监督学习（unsupervised learning）三者共同构成了机器学习的三个重要方面 Rei

>>阅读原文<<