强化学习三:Dynamic Programming

强化学习三:Dynamic Programming 1,Introduction 1.1 What is Dynamic Programming?     Dynamic:某个问题是由序列化状态组成,状态step-by-step的改变,从而可以step-by-step的来解这个问题。     Programming:是在已知环境动力学的基础上进行评估和控制,具体来说就是在了解包括状态和行为空间、转
相关文章
相关标签/搜索