【深度强化学习】强化学习的基本概念

文章目录 前言 第一章:强化学习的基本概念 学习——监督, 无监督与强化学习 强化学习的体系与联系 Reward 奖励 Agent Environment Actions Observation 马尔科夫决策过程 马尔科夫链 马尔科夫奖励过程 马尔科夫决策过程 Policy 总结 前言 重读《Deep Reinforcemnet Learning Hands-on》, 常读常新, 极其深入浅出的一
相关文章
相关标签/搜索