Soft Actor-Critic:适用于机器人的深度强化学习

文 / Tuomas Haarnoja,学生研究员;Sergey Levine,Google 机器人团队指导教师 深度强化学习 (RL) 能够借助通用的神经网络表征来处理复杂的感官输入,因此可让机器人直接从现实世界的经验与互动中完全自主地学习行为。然而,许多现有的 RL 算法均需几天或几周(甚至更久)的真实数据才能实现所期望的行为。此外,我们很难在复杂的机器人系统(比如多足机器人)上部署这样的系统
相关文章
相关标签/搜索