JavaShuo
栏目
标签
【李宏毅2020 ML/DL】P110-111 Policy Gradient & Proximal Policy Optimization
时间 2021-01-02
标签
李宏毅深度学习
强化学习
DRL
TRPO
PPO
繁體版
原文
原文链接
我已经有两年 ML 经历,这系列课主要用来查缺补漏,会记录一些细节的、自己不知道的东西。 关于强化学习,我专门花半年时间学习实践过,因此这里笔记只记录李老师的 outline 。我的强化学习资源仓库: https://github.com/PiperLiu/Reinforcement-Learning-practice-zh 我的 CSDN 强化学习博客集合: https://blog.csdn.
>>阅读原文<<
相关文章
1.
2020李宏毅学习笔记——66 RL Advanced Version 2.Proximal Policy Optimization
2.
【学习笔记】PPO(Proximal Policy Optimization) - 李宏毅
3.
Proximal Policy Optimization (PPO)
4.
3.Proximal Policy Optimization(PPO)+on/off policy
5.
【完结】李宏毅深度强化学习笔记(二)Proximal Policy Optimization (PPO)
6.
Proximal Policy Optimization (PPO)详解
7.
【笔记2-2】李宏毅深度强化学习笔记(二)Proximal Policy Optimization (PPO)
8.
机器学习:李宏毅强化学习笔记(一)Proximal Policy Optimization (PPO)
9.
2020李宏毅学习笔记——65 RL Advanced Version 1.Policy Gradient
10.
【深度强化学习】5. Proximal Policy Optimization
更多相关文章...
•
Redis内存回收策略
-
Redis教程
•
R 数据框
-
R 语言教程
•
Docker容器实战(一) - 封神Server端技术
•
Docker容器实战(八) - 漫谈 Kubernetes 的本质
相关标签/搜索
policy
李宏毅
gradient
proximal
optimization
李彦宏
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
resiprocate 之repro使用
2.
Ubuntu配置Github并且新建仓库push代码,从已有仓库clone代码,并且push
3.
设计模式9——模板方法模式
4.
avue crud form组件的快速配置使用方法详细讲解
5.
python基础B
6.
从零开始···将工程上传到github
7.
Eclipse插件篇
8.
Oracle网络服务 独立监听的配置
9.
php7 fmp模式
10.
第5章 Linux文件及目录管理命令基础
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
2020李宏毅学习笔记——66 RL Advanced Version 2.Proximal Policy Optimization
2.
【学习笔记】PPO(Proximal Policy Optimization) - 李宏毅
3.
Proximal Policy Optimization (PPO)
4.
3.Proximal Policy Optimization(PPO)+on/off policy
5.
【完结】李宏毅深度强化学习笔记(二)Proximal Policy Optimization (PPO)
6.
Proximal Policy Optimization (PPO)详解
7.
【笔记2-2】李宏毅深度强化学习笔记(二)Proximal Policy Optimization (PPO)
8.
机器学习:李宏毅强化学习笔记(一)Proximal Policy Optimization (PPO)
9.
2020李宏毅学习笔记——65 RL Advanced Version 1.Policy Gradient
10.
【深度强化学习】5. Proximal Policy Optimization
>>更多相关文章<<