为什么说强化学习是一种人工智能的通用框架？

时间 2020-12-29

原文原文链接

深度强化学习(Deep Reinforcement Learning) ，强化学习是一种人工智能的通用框架： 1、强化学习是针对一个拥有行动能力的agent 而言的 2、每个行动影响了agent 的未来状态 3、使用标量值回报信号来度量成功一言以蔽之：选择行动来最大化未来回报。我们最终的目标是寻求得到可以解决所有人类层级的任务的单一的agent，这也是智能agent 的本质。 agent和环境