强化学习: Experience Replay

我第一次接触 Experience Replay 概念是李宏毅老师的视频课上。当时李宏毅老师说 为什么Experience Replay 可行留作自己思考,然后并没有做太详细的解释。接下来,我就把我对Experience Replay 的理解写下来。 首先,我把李宏毅老师的Q-learning 算法贴出来,他的Q-learning 算法跟传统Q-learning 算法有一些微小的区别 以下是Exp
相关文章
相关标签/搜索