[Reinforcement Learning] 动态规划(Planning)

[Reinforcement Learning] 动态规划(Planning) 动态规划 动态规划(Dynamic Programming,简称DP)是一种通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。 动态规划常常适用于具有如下性质的问题: 具有最优子结构(Optimal substructure) Principle of optimality applies Optimal s
相关文章
相关标签/搜索