论文阅读之:PRIORITIZED EXPERIENCE REPLAY

  PRIORITIZED EXPERIENCE REPLAY ICLR 2016   经验回放使得 online reinforcement learning agent 能够记住并且回放过去的经验。在先前的工作中,从回放记忆中随机的采样 experience transitions。但是,这种方法简单的在同一频率 回放 transitions,而不管其意义。本文提出了一种方法能够实现优先回放,
相关文章
相关标签/搜索