强化学习入门学习记录

时间 2021-01-16

原文原文链接

最近学习了RL，感觉RL属于机器学习中比较有意思的一个领域，监督学习、无监督学习都是扔一堆静止的数据去训练你的模型，而强化学习是让模型与环境的交互中进行学习，让人感觉更像一种有智慧的生物（然而并不是）。比如需要让机器学会玩一个游戏有两种方法： 1. 有监督学习 (专家级玩家玩无数次，记录下结果作为有标记数据) 2. 强化学习强化学习是在与环境的交互中不断得到反馈进行学习的，就像一个真实的生命

>>阅读原文<<