入门强化学习1

时间 2021-01-11

标签强化学习繁體版

原文原文链接

1.初识强化学习（RL） 2.课程基础 3.资料学习 4.基本概念核心思想：智能体agent在环境environment中学习，根据环境的状态state，执行动作action，并根据环境的反馈reward（奖励）来指导更好的动作。特点：不断和环境交互，观察和输出动作奖励延迟应用场景：游戏个性推荐股票交通强化学习与监督学习的区别：

>>阅读原文<<

最新文章

欢迎关注本站公众号,获取更多信息