强化学习(二):马尔科夫决策过程(Markov decision process)

本章是强化学习的基础,主要讲的就是马尔科夫决策过程,之后的内容都是以这一节为基础的,因此对本节的相关概念的理解是很重要的。web 这一节的概念比较多,也是后面章节的基础,一开始笔者也是一头雾水,只有多看几遍,多去思考,才能慢慢理解。毕竟概念与定义比较多,想要一会儿消化完仍是有一些难度的。这篇博客也是笔者看完David Silver的公开课与其它一些参考资料后的理解,但愿对你们有所帮助。算法 为何在
相关文章
相关标签/搜索