强化学习Q learning与policy gradient

开始学习强化学习:git 包括alphago等都是强化学习的典型。github 最典型的强化学习的算法为Q learning,这个算法的简介博客:算法 https://www.zhihu.com/question/26408259 网络 强化学习的github项目:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflo
相关文章
相关标签/搜索