伯克利新研究:让深度强化学习不再一条道走到黑 | Paper+Code

本文来自AI新媒体量子位(QbitAI) 来自加州大学伯克利分校的博士生唐浩然(Haoran Tang)和Tuomas Haarnoja今天发表博客文章,介绍了他们的一项新研究。原标题《通过最大熵深度强化学习掌握不同的技能》,以下是文章的主要内容。 标准的深度强化学习,旨在掌握单一方法来解决给定的任务。但只有一种解决方案是不够的,因为智能体很容易受到现实世界中常见环境变化的影响。 例如,一个在简单
相关文章
相关标签/搜索