从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning

        本文目前主要是写给自己的一个笔记,接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏,如果能间接帮助到他人就最好不过了,不喜勿喷。         上一篇我们已经找到了需要输入神经网络的数据(也就是observation 是GYM提供的代表一定意义的数,每个游戏不同),和神经网络需要输出的值(也就是action 需要控制游戏的值)
相关文章
相关标签/搜索