David Silver强化学习公开课(八):整合学习与规划

本课程以前全部的内容都没有说起到个体如何构建一个模拟环境的模型,天然也没有讲解个体构建一个模拟环境的模型对于解决MDP问题有何帮助。本讲即关注这两个问题。经过构建一个模型,个体具有了必定程度的独立思考能力,即在与环境发生实际交互以前思考各类可能的行为其对能带给环境及自身的改变。经过个体的思考以及联合其与环境的实际交互经验,个体在解决大规模MDP问题时能够取得更好的结果。本讲涉及的内容多属于宏观架构
相关文章
相关标签/搜索