强化学习 - 概述

强化学习-概述 课程来自 Udacity-Reinforcement Learning(2017)- 1.Smoov & Curly’s Bogus Journey 的笔记整理web 强化学习的”Hello-world” 规则 绿色是目标 红色是失败 黑色是墙 start是开始点 你要找到一条从start到目标的路径 思考 若是给定一个附加几率:按着想法走的0.8,不按想法走的0.2。若是咱们假定
相关文章
相关标签/搜索