强化学习Q learning与policy gradient

时间 2020-12-24

原文原文链接

开始学习强化学习：包括alphago等都是强化学习的典型。最典型的强化学习的算法为Q learning，这个算法的简介博客： https://www.zhihu.com/question/26408259 强化学习的github项目：https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 里面包含了很多算法的例子