[增强学习][Reinforcement Learning]学习笔记与回顾-2-马尔可夫决策过程MDP

Markov Decision Processes 前言 本文主要是视频学习的总结与回顾,想要了解更多内容请看视频或者学习专业课程。这一节主要是说马尔可夫决策过程-Markov Decision Processes,也成MDP。 在了解MDP之前,如果大家了解过马尔可夫链(markov chain),或者机器学习中的隐马尔可夫过程,那么对于马尔可夫性就会有一定了解,即无后效性。 Introduct
相关文章
相关标签/搜索