基本概念篇(二),强化学习过程

上篇文章介绍了强化学习的八个基本要素,利用这些要素,我们就可以将一个完整的强化学习过程描述出来。 强化学习基本过程与目标 大家在看其他的参考书时,在这部分其实都是把强化学习的过程描述为一个“马尔科夫决策过程”。我们首先可以回忆一下上一节中那个图,首先就是将强化学习过程离散化,分成一步一步的过程。那么这其中最重要的马尔科夫特性,其实讲的就是每一步之间的关系。简单来说,就是系统这一步的状态,只与系统前
相关文章
相关标签/搜索