强化学习基础 | (18) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)

原文地址 在基于模型的强化学习与Dyna算法框架中,我们讨论基于模型的强化学习方法的基本思路,以及集合基于模型与不基于模型的强化学习框架Dyna。本文我们讨论另一种非常流行的集合基于模型与不基于模型的强化学习方法:基于模拟的搜索(Simulation Based Search)。 本篇主要参考了UCL强化学习课程的第八讲,第九讲部分。 1. 基于模拟的搜索概述 什么是基于模拟的搜索呢?当然主要是两
相关文章
相关标签/搜索