【深度强化学习】强化学习的基本概念

时间 2021-01-15

标签 python 深度强化学习理论文献强化学习深度学习人工智能栏目 Python 繁體版

原文原文链接

文章目录前言第一章：强化学习的基本概念学习——监督，无监督与强化学习强化学习的体系与联系 Reward 奖励 Agent Environment Actions Observation 马尔科夫决策过程马尔科夫链马尔科夫奖励过程马尔科夫决策过程 Policy 总结前言重读《Deep Reinforcemnet Learning Hands-on》，常读常新，极其深入浅出的一

>>阅读原文<<