学习笔记(02):决胜AI-强化学习实战系列视频课程-马尔科夫决策过程

立即学习:https://edu.csdn.net/course/play/4916/88697?utm_source=blogtoedu 马尔科夫决策过程 能用马尔科夫过程的前提条件: 1. 能够检测到理想的状态     如:alphaGo知道什么样子是赢 2. 可以多次尝试 3. 系统的下个状态只与当前状态信息有关,耳语更早之前的状态无关。在决策过程中还与当前采取的动作有关。     马尔科夫
相关文章
相关标签/搜索