强化学习介绍(RL)

1、简介 机器学习有三大分支,监督学习、无监督学习和强化学习,强化学习是系统从环境学习以使得奖励最大的机器学习。**人工智能中称之为强化学习,在控制论中被称之为动态规划,二者在概念上是等价的。**也被翻译为加强学习。web 2、概念 不一样于机器学习的其它两个分支: 它不是无监督学习,由于有回报(Reward)信号 反馈是延时的,而不是即时的 数据是与时间有关的序列 智能体的动做与后续的数据有关
相关文章
相关标签/搜索