David Silver《Reinforcement Learning》课程解读—— Lecture 5： Model-Free Control

时间 2021-01-11

原文原文链接

David Silver《Reinforcement Learning》课程解读—— Lecture 5： Model-Free Control 上次课谈到了在给定policy的情况下求解未知environment的MDP问题，称之为Model-Free Prediction问题。本节则是解决未知policy情况下未知environment的MDP问题，也就是Model-Free Control问