深度强化学习系列（二）：强化学习基础

时间 2021-01-01

原文原文链接

本文是强化学习的基础，主要参考 Divid Silver 教程，Reinforcement Learning：An Introduction，以及周志华的西瓜书。可能之前大家已经听过了强化学习的介绍，因此，我首先问几个问题：强化学习和MDP过程是一回事吗？强化学习和监督学习的区别是什么？什么是值迭代，什么是策略迭代？有模型和无模型的强化学习的各自有什么样的学习方法？强化学习和深度学习其

>>阅读原文<<