David Silver强化学习课程笔记(八)(下)

第八课(下):基于Simulation的搜索方法         在《第八课(上):学习与规划的结合》中,咱们讲到了Model-Based RL方法,在该方法中,咱们首先拟合获得一个模型,而后能够利用各类规划方法进行规划,或者,能够引伸出Sample-Based Planning,也即咱们并非去采用贝尔曼方程计算,而是用模型进行采样,而后利用Model-Free方法进行学习。本文中要讲的Simul
相关文章
相关标签/搜索