强化学习的自然环境基准

 2020-05-11 05:09:10   作者 | wang王编辑 | 丛末 虽然当前的基准强化学习(RL)任务对于推动这一领域的进展大有裨益,但在许多方面还不能很好地替代真实数据的学习。在低复杂度的仿真环境中测试日益复杂的RL算法,获得的RL策略难以推广。 论文地址:https://arxiv.org/pdf/1811.06032.pdf 为解决此问题,本文提出了3个新的基准RL域体系,包含
相关文章
相关标签/搜索