JavaShuo
栏目
标签
强化学习入门(二):on-policy与off-policy
时间 2021-01-21
标签
# 强化学习
机器学习
繁體版
原文
原文链接
一、名词解释即引入原因 1、名词解释: 翻译过来就是: On-policy: 学习到的agent以及和环境进行互动的agent是同一个agent Off-policy: 学习到的agent以及和环境进行互动的agent是不同的agent 直观理解就是: On-policy:相当于你在打游戏,你在实战中变强。 Off-policy:相当于你在看直播,你在观摩中变强。 2、为何要引入 Off-poli
>>阅读原文<<
相关文章
1.
强化学习 入门(二)
2.
强化学习入门
3.
入门强化学习1
4.
强化学习 入门(一)
5.
强化学习入门(一)
6.
强化学习入门……的入门
7.
【强化学习】入门学习
8.
强化学习入门学习记录
9.
学习总结——强化学习入门
10.
强化学习系列 1:强化学习入门简介
更多相关文章...
•
Memcached入门教程
-
NoSQL教程
•
您已经学习了 XML Schema,下一步学习什么呢?
-
XML Schema 教程
•
Kotlin学习(二)基本类型
•
YAML 入门教程
相关标签/搜索
强化学习
强化学习篇
机器学习入门二
Go 入门学习
Go入门学习
ffmepg入门学习
ffmpeg入门学习
深度强化学习入门
强化
入门必学
Hibernate教程
PHP教程
Thymeleaf 教程
学习路线
初学者
代码格式化
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
Android Studio3.4中出现某个项目全部乱码的情况之解决方式
2.
Packet Capture
3.
Android 开发之 仿腾讯视频全部频道 RecyclerView 拖拽 + 固定首个
4.
rg.exe占用cpu导致卡顿解决办法
5.
X64内核之IA32e模式
6.
DIY(也即Build Your Own) vSAN时,选择SSD需要注意的事项
7.
选择深圳网络推广外包要注意哪些问题
8.
店铺运营做好选款、测款的工作需要注意哪些东西?
9.
企业找SEO外包公司需要注意哪几点
10.
Fluid Mask 抠图 换背景教程
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
强化学习 入门(二)
2.
强化学习入门
3.
入门强化学习1
4.
强化学习 入门(一)
5.
强化学习入门(一)
6.
强化学习入门……的入门
7.
【强化学习】入门学习
8.
强化学习入门学习记录
9.
学习总结——强化学习入门
10.
强化学习系列 1:强化学习入门简介
>>更多相关文章<<