强化学习入门学习记录

最近学习了RL, 感觉RL属于机器学习中比较有意思的一个领域,监督学习、无监督学习都是扔一堆静止的数据去训练你的模型,而强化学习是让模型与环境的交互中进行学习,让人感觉更像一种有智慧的生物(然而并不是)。比如需要让机器学会玩一个游戏 有两种方法: 1. 有监督学习 (专家级玩家玩无数次,记录下结果作为有标记数据) 2. 强化学习 强化学习是在与环境的交互中不断得到反馈进行学习的,就像一个真实的生命
相关文章
相关标签/搜索