【莫烦强化学习】视频笔记(一)2. 强化学习方法汇总

【莫烦强化学习系列视频】笔记本 第2节 强化学习方法汇总 本节的目的更多是对强化学习的方法及特征有初步的了解。我们可以通过将强化学习方法分类,来逐一理解。 首先是通过是否需要理解环境(环境给我们什么就是什么),能够分为无模型的强化学习方法和基于模型的强化学习方法。 假设这里有一个机器人和一个星球X。 无模型的强化学习方法(Model-Free): 不需要理解环境,机器人对星球X一无所知,机器人扔了
相关文章
相关标签/搜索