David silver 强化学习公开课笔记(三):Planning by Dynamic Programming

1 引言 动态规划一开始我不是很理解,先看PPT上的解释: 即是一个方法,把一个复杂的问题分解成子问题,通过综合子问题的解来解决问题。我看了一个文章,说的不错,也感觉理解的差不多了,链接:https://www.sohu.com/a/153858619_466939。 动态规划问题满足两个性质: (1)最优子结构(Optimal substructure) (2)重叠子问题(Overlapping
相关文章
相关标签/搜索