深度强化学习系列(二):强化学习基础

本文是强化学习的基础,主要参考 Divid Silver 教程,Reinforcement Learning:An Introduction,以及周志华的西瓜书。 可能之前大家已经听过了强化学习的介绍,因此,我首先问几个问题: 强化学习和MDP过程是一回事吗? 强化学习和监督学习的区别是什么? 什么是值迭代,什么是策略迭代? 有模型和无模型的强化学习的各自有什么样的学习方法? 强化学习和深度学习其
相关文章
相关标签/搜索