[增强学习][Reinforcement Learning]学习笔记与回顾-2-马尔可夫决策过程MDP

时间 2021-01-02

原文原文链接

Markov Decision Processes 前言本文主要是视频学习的总结与回顾，想要了解更多内容请看视频或者学习专业课程。这一节主要是说马尔可夫决策过程-Markov Decision Processes，也成MDP。在了解MDP之前，如果大家了解过马尔可夫链（markov chain）,或者机器学习中的隐马尔可夫过程，那么对于马尔可夫性就会有一定了解，即无后效性。 Introduct

>>阅读原文<<