论文阅读之：PRIORITIZED EXPERIENCE REPLAY

时间 2021-01-19

原文原文链接

PRIORITIZED EXPERIENCE REPLAY ICLR 2016 　　经验回放使得 online reinforcement learning agent 能够记住并且回放过去的经验。在先前的工作中，从回放记忆中随机的采样 experience transitions。但是，这种方法简单的在同一频率回放 transitions，而不管其意义。本文提出了一种方法能够实现优先回放，