David Silver强化学习课程笔记(四)

第四课:模型无关的预测         在进入正题之前,先说点题外话哈,等《David Silver课程学习笔记》系列更新完成之后,我们将会更新《PRML学习笔记》以及《RL学习笔记》,到时候希望大家多多指教哟~           在第三课中,我们介绍了动态规划方法(DP),提到DP既可用于预测,也可用于控制,但是不管怎么说,这种方法总是离不开模型的:                我们需要知道
相关文章
相关标签/搜索