强化学习的常用方法

上一节我们讲述了马尔可夫过程, 这一节我们要讲的是强化学习中常用的方法。 Model-free和Model-based 我们可以将所有强化学习的方法分为理不理解所处环境,如果我们不尝试去理解环境, 环境给了我们什么就是什么. 我们就把这种方法叫做 model-free, 这里的 model 就是用模型来表示环境, 那理解了环境也就是学会了用一个模型来代表环境, 所以这种就是 model-based
相关文章
相关标签/搜索