深度强化学习初窥之DQN

时间 2021-01-09

原文原文链接

最近对强化学习特别是深度强化学习做了一番了解，不像以前只是大概模模糊糊有个影子，为了加深印象，决定把相关内容记到这里。首先对强化学习做简要的介绍，之后介绍一下需要的相关背景知识，然后重点介绍一下深度Q学习（DQN）的算法理论以及实现过程。关于强化学习，今年最为着名成功实践莫过于谷歌deep mind的alpha go，其于今年三月以4：1的比分击败了现役围棋选手中冠军数最多的李世石九段。由于围棋

>>阅读原文<<