【转载】David Silver公开课5——Model-Free Control

Model-Free Control(解决未知Environment下的Control问题) 本文是David Silver强化学习公开课第五课的总结笔记。这一课主要讲了解决在未知policy未知environment的情况下control问题的两种思路,即On-Policy和Off-Policy,在第四课的Monte-Carlo和Temporal Difference基础上进行改进。 【转载自】
相关文章
相关标签/搜索