强化学习入门——使用DQN训练CartPole

       作为刚入门强化学习的小白,最近几天在写一些基础的代码,使用DQN训练CartPole问题。        DQN是2013年DeepMind提出来的使用Q-learning与神经网络相结合的方法,其实和Q-learning的思想相同,只不过是计算的时候使用神经网络计算Q值。Q-learning简要说一下,就是使用函数逼近的方法,在选择动作时使用epsilon-greedy的方法,在更
相关文章
相关标签/搜索