为什么说强化学习是一种人工智能的通用框架?

深度强化学习(Deep Reinforcement Learning) ,强化学习是一种人工智能的通用框架: 1、强化学习是针对一个拥有行动能力的agent 而言的 2、每个行动影响了agent 的未来状态 3、使用标量值回报信号来度量成功 一言以蔽之:选择行动来最大化未来回报。我们最终的目标是寻求得到可以解决所有人类层级的任务的单一的agent,这也是智能agent 的本质。 agent和环境
相关文章
相关标签/搜索