David Silver深度强化学习第4课-免模型预测

https://www.bilibili.com/video/av9831252 http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching_files/MC-TD.pdf Model-Free reinforcement learning 方法1:Mente-Carlo Reinforement learning (MC方法是最有效,应用最广泛的方法
相关文章
相关标签/搜索