强化学习 - 概述

强化学习-概述 课程来自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的笔记整理 强化学习的”Hello-world” 规则 绿色是目标 红色是失败 黑色是墙 start是开始点 你要找到一条从start到目标的路径 思考 如果给定一个附加概率:按着想法走的0.8,不按想法走的0.2。如果我们假定正确序
相关文章
相关标签/搜索