论文阅读15:Massively Parallel Methods for Deep Reinforcement Learning

  论文阅读笔记之Massively Parallel Methods for Deep Reinforcement Learning 本文创新点:提出了一个对于深度强化学习的大规模分布式架构Gorila(General Reinforcement learning Architecture) 架构组成:用于产生behavior的并行actor组; 从经验池学习的并行learner组; 代表值函数
相关文章
相关标签/搜索