强化学习导论(Reinforcement Learning:An Introduction)学习笔记(七)

Part I: 表格解决方法 ​ 在本书的这一部分中,咱们以最简单的形式描述了几乎全部强化学习算法的核心思想:算法中的状态和动做空间足够小,能够将近似值函数表示为数组或表格。 在这种状况下,这些方法一般能够找到确切的解决方案,也就是说,他们常常能够找到最佳的价值函数和最优策略。这与本书下一部分描述的近似方法造成对比,后者只找到近似解, 可是做为回报能够有效应用于更大的问题。web ​ 本书的这一部
相关文章
相关标签/搜索