【强化学习】第一篇--马尔科夫决策过程

作者:王小草 笔记时间:2019年1月20日 1 马尔科夫性质与过程 1.1 马尔科夫性质 马尔科夫性质即: 系统的下一状态只与当前状态有关,与以前的历史状态无关。 公式表达: 特点: 当前状态蕴含所有相关历史信息 一旦当前状态已知,历史信息将会被抛弃 1.2 马尔科夫过程 马尔科夫过程即: 该过程中所有状态都满足马尔科夫性。 表示: 马尔科夫过程可以用一个二元组表示(S, P) S 是一个有限的
相关文章
相关标签/搜索