第一课 强化学习简介

David silver强化学习课程第一课 强化学习简介 本章主要介绍了强化学习涉及到的一些基础概念,包括强化学习解决的是哪类问题,涉及哪些要素以及解决强化学习问题的思路。 1 强化学习的特征 是什么使得强化学习不同于其他机器学习范式呢? 不存在监督,只有奖励作为指导信号 奖励是延迟的,比如游戏结束时反馈一个正/负信号(也存在实时奖励吧,比如迷宫游戏为了寻找最短路径,每走一步奖励设置为-1) 事件
相关文章
相关标签/搜索