强化学习笔记1-有限马尔可夫决策过程

这个系列的笔记打算写的是看了david silver的视频和sutton的introduction to rl(前几章)后的摘要,大概就是我以为重要的东西。html 我发现david silver的视频和introduction在大纲内容上是很是类似的,具体细节上,David silver的视频更强调实用,会有一些比较新的内容,sutton的书更理论,有助于完整地理解强化学习的本质。web 这个笔
相关文章
相关标签/搜索