深度强化学习初窥之DQN

最近对强化学习特别是深度强化学习做了一番了解,不像以前只是大概模模糊糊有个影子,为了加深印象,决定把相关内容记到这里。首先对强化学习做简要的介绍,之后介绍一下需要的相关背景知识,然后重点介绍一下深度Q学习(DQN)的算法理论以及实现过程。 关于强化学习,今年最为着名成功实践莫过于谷歌deep mind的alpha go,其于今年三月以4:1的比分击败了现役围棋选手中冠军数最多的李世石九段。由于围棋
相关文章
相关标签/搜索