知乎《强化学习知识大讲坛》学习笔记

强化学习入门 第一讲 MDP函数 https://zhuanlan.zhihu.com/p/25498081 学习 强化学习入门 第二讲 基于模型的动态规划方法入门 https://zhuanlan.zhihu.com/p/25580624 进阶 强化学习入门 第三讲蒙特卡罗方法搜索 https://zhuanlan.zhihu.com/p/25743759 方法 强化学习入门 第四讲 时间差分法
相关文章
相关标签/搜索