强化学习导论（Reinforcement Learning：An Introduction）学习笔记（七）

时间 2019-12-06

标签强化学习导论 reinforcement learning introduction 笔记栏目应用数学繁體版

原文原文链接

Part I: 表格解决方法在本书的这一部分中，咱们以最简单的形式描述了几乎全部强化学习算法的核心思想：算法中的状态和动做空间足够小，能够将近似值函数表示为数组或表格。在这种状况下，这些方法一般能够找到确切的解决方案，也就是说，他们常常能够找到最佳的价值函数和最优策略。这与本书下一部分描述的近似方法造成对比，后者只找到近似解，可是做为回报能够有效应用于更大的问题。web 本书的这一部

>>阅读原文<<