强化学习笔记(7)基于模型的RL / Dyna算法/ MCTS

文章目录 Introduction model-Free Model-Based RL Advantages Disadvantages Model定义 目标 一些模型表示方法: 计划 Planning Sample-Based Planning 基于采样的计划 整合Model-Free 和 Model-Based 两种经验来源: Dyna 基于模拟的搜索 前向搜索算法 Foward Search
相关文章
相关标签/搜索