强化学习(Reinforcement Learning)知识整理

传送门:https://zhuanlan.zhihu.com/p/25319023算法 由于准备投入学习 CS294,具体见 知乎专栏,复习了下以前学习 Udacity 和 CS181 中有关强化学习部分的笔记和资料,再看了遍 David Silver 课程的 PPT,整理成了这篇文章。ide 马尔可夫决策过程(Markov Decision Processes,MDPs) MDPs 简单说就是一
相关文章
相关标签/搜索