DRL笔记系列一

时间 2021-01-22

标签 DRL 算法繁體版

原文原文链接

参考链接基本概念 trial and error DRL=RL+deep_learning on-policy：所有数据都是当前agent与env交互后产生的，训练时不使用old data，即不使用以前agent产生的数据缺点：these algorithms works weaker on sample efficiency 优点：these algorithms directly opti

>>阅读原文<<

1. Redis系列-Redis笔记（一）
2. Datawhale DRL task1 随笔
3. react系列笔记：第一记-redux
4. django系列笔记
5. JavaScript学习笔记系列(一)
6. ES6读书笔记汇总系列(一)
7. machine learning个人笔记系列（一）
8. Redis 学习笔记系列一
9. spring boot 2.0系列笔记(一)
10. Android学习系列笔记（一）
更多相关文章...
• Hibernate一对多映射关系 - Hibernate教程
• ASP.NET Razor - 标记 - ASP.NET 教程
• Tomcat学习笔记（史上最全tomcat学习笔记）
• Docker容器实战(七) - 容器眼光下的文件系统

最新文章

1. 跳槽面试的几个实用小技巧，不妨看看！
2. Mac实用技巧 |如何使用Mac系统中自带的预览工具将图片变成黑白色?
3. Mac实用技巧 |如何使用Mac系统中自带的预览工具将图片变成黑白色?
4. 如何使用Mac系统中自带的预览工具将图片变成黑白色?
5. Mac OS非兼容Windows软件运行解决方案——“以VMware & Microsoft Access为例“
6. 封装 pyinstaller -F -i b.ico excel.py
7. 数据库作业三ER图待完善
8. nvm安装使用低版本node.js(非命令安装)
9. 如何快速转换图片格式
10. 将表格内容分条转换为若干文档

本站公众号

欢迎关注本站公众号,获取更多信息

1. Redis系列-Redis笔记（一）
2. Datawhale DRL task1 随笔
3. react系列笔记：第一记-redux
4. django系列笔记
5. JavaScript学习笔记系列(一)
6. ES6读书笔记汇总系列(一)
7. machine learning个人笔记系列（一）
8. Redis 学习笔记系列一
9. spring boot 2.0系列笔记(一)
10. Android学习系列笔记（一）

>>更多相关文章<<