JavaShuo
栏目
标签
生成对抗树搜索的样本高效的深度强化学习
时间 2021-01-07
标签
Generative Adversarial Network
Reinforcement Learning
GenerativeAdversarial Tree Sea
栏目
系统网络
繁體版
原文
原文链接
摘要 我们提出了一种样本高效的深度强化学习(DRL)算法——生成对抗树搜索(GATS)。在强化学习(RL)的搜索和规划中,尽管蒙特卡洛(MCTS)被认为是有效的,但其通常是样本低效的,从而应用到实践中成本高昂。在这项工作中,我们开发了一个用于对环境动力学建模的生成对抗网络(GAN)架构和奖励函数预测器模型。我们利用从与环境交互收集到的数据来学习这些模型,我们把这些模型用作基于模型的规划。在规划期
>>阅读原文<<
相关文章
1.
深度学习---对抗样本生成
2.
FGSM(Fast Gradient Sign Method)生成对抗样本(32)---《深度学习》
3.
深度学习中的强化学习和对抗学习
4.
对抗搜索(学习了)
5.
李纪为:用于对话生成的深度强化学习
6.
ACL2020 | 使用强化学习为机器翻译生成对抗样本
7.
深度学习样本生成data augmentation
8.
深度学习对抗样本的八个误解与事实
9.
【深度强化学习】强化学习的基本概念
10.
深度学习——生成对抗网络--GAN/深度卷积生成对抗网络--DCGAN
更多相关文章...
•
SEO - 搜索引擎优化
-
网站建设指南
•
Eclipse 生成jar包
-
Eclipse 教程
•
适用于PHP初学者的学习线路和建议
•
Kotlin学习(二)基本类型
相关标签/搜索
强化学习
对象的学习
深度学习
强的
万能的搜索
深的
高的
生的
我的学习
搜索
系统网络
Hibernate教程
MyBatis教程
PHP教程
学习路线
调度
初学者
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
windows下配置opencv
2.
HED神经网
3.
win 10+ annaconda+opencv
4.
ORB-SLAM3系列-多地图管理
5.
opencv报错——(mtype == CV_8U || mtype == CV_8S)
6.
OpenCV计算机视觉学习(9)——图像直方图 & 直方图均衡化
7.
【超详细】深度学习原理与算法第1篇---前馈神经网络,感知机,BP神经网络
8.
Python数据预处理
9.
ArcGIS网络概述
10.
数据清洗(三)------检查数据逻辑错误
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
深度学习---对抗样本生成
2.
FGSM(Fast Gradient Sign Method)生成对抗样本(32)---《深度学习》
3.
深度学习中的强化学习和对抗学习
4.
对抗搜索(学习了)
5.
李纪为:用于对话生成的深度强化学习
6.
ACL2020 | 使用强化学习为机器翻译生成对抗样本
7.
深度学习样本生成data augmentation
8.
深度学习对抗样本的八个误解与事实
9.
【深度强化学习】强化学习的基本概念
10.
深度学习——生成对抗网络--GAN/深度卷积生成对抗网络--DCGAN
>>更多相关文章<<