强化学习二、MDP

        前面已经讲解了什么是强化学习,也以Maze游戏为例形象的介绍了强化学习涉及到的主要概念:S、A、P、R、γ,但并未涉及到数学公式。想了解强化学习的朋友可以参考链接https://blog.csdn.net/wshzd/article/details/103372419。本文将以马尔科夫决策过程MDP(Markov decision processes)为例详细介绍这些概念之间的关系
相关文章
相关标签/搜索