强化学习入门——使用DQN训练CartPole

时间 2021-01-02

原文原文链接

作为刚入门强化学习的小白，最近几天在写一些基础的代码，使用DQN训练CartPole问题。 DQN是2013年DeepMind提出来的使用Q-learning与神经网络相结合的方法，其实和Q-learning的思想相同，只不过是计算的时候使用神经网络计算Q值。Q-learning简要说一下，就是使用函数逼近的方法，在选择动作时使用epsilon-greedy的方法，在更