【李宏毅2020 ML/DL】P110-111 Policy Gradient & Proximal Policy Optimization

时间 2021-01-02

标签李宏毅深度学习强化学习 DRL TRPO PPO 繁體版

原文原文链接

我已经有两年 ML 经历，这系列课主要用来查缺补漏，会记录一些细节的、自己不知道的东西。关于强化学习，我专门花半年时间学习实践过，因此这里笔记只记录李老师的 outline 。我的强化学习资源仓库： https://github.com/PiperLiu/Reinforcement-Learning-practice-zh 我的 CSDN 强化学习博客集合： https://blog.csdn.

>>阅读原文<<

1. 2020李宏毅学习笔记——66 RL Advanced Version 2.Proximal Policy Optimization
2. 【学习笔记】PPO(Proximal Policy Optimization) - 李宏毅
3. Proximal Policy Optimization (PPO)
4. 3.Proximal Policy Optimization(PPO)+on/off policy
5. 【完结】李宏毅深度强化学习笔记（二）Proximal Policy Optimization (PPO)
6. Proximal Policy Optimization (PPO)详解
7. 【笔记2-2】李宏毅深度强化学习笔记（二）Proximal Policy Optimization (PPO)
8. 机器学习：李宏毅强化学习笔记（一）Proximal Policy Optimization (PPO)
9. 2020李宏毅学习笔记——65 RL Advanced Version 1.Policy Gradient
10. 【深度强化学习】5. Proximal Policy Optimization
更多相关文章...
• Redis内存回收策略 - Redis教程
• R 数据框 - R 语言教程
• Docker容器实战(一) - 封神Server端技术
• Docker容器实战(八) - 漫谈 Kubernetes 的本质

最新文章

1. FM理论与实践
2. Google开发者大会，你想知道的都在这里
3. IRIG-B码对时理解
4. 干货：嵌入式系统设计开发大全！（万字总结）
5. 从域名到网站—虚机篇
6. php学习5
7. 关于ANR线程阻塞那些坑
8. android studio databinding和include使用控件id获取报错不影响项目正常运行
9. 我女朋友都会的安卓逆向（四动态调试smali）
10. io存取速度

本站公众号

欢迎关注本站公众号,获取更多信息

1. 2020李宏毅学习笔记——66 RL Advanced Version 2.Proximal Policy Optimization
2. 【学习笔记】PPO(Proximal Policy Optimization) - 李宏毅
3. Proximal Policy Optimization (PPO)
4. 3.Proximal Policy Optimization(PPO)+on/off policy
5. 【完结】李宏毅深度强化学习笔记（二）Proximal Policy Optimization (PPO)
6. Proximal Policy Optimization (PPO)详解
7. 【笔记2-2】李宏毅深度强化学习笔记（二）Proximal Policy Optimization (PPO)
8. 机器学习：李宏毅强化学习笔记（一）Proximal Policy Optimization (PPO)
9. 2020李宏毅学习笔记——65 RL Advanced Version 1.Policy Gradient
10. 【深度强化学习】5. Proximal Policy Optimization

>>更多相关文章<<