从零使用强化学习训练AI玩儿游戏(3)——使用Q-learning

时间 2021-01-13

原文原文链接

本文目前主要是写给自己的一个笔记，接下来这段时间会逐步记录我是怎么通过学习使用TensorFlow+Keras训练神经网络自己玩儿游戏，如果能间接帮助到他人就最好不过了，不喜勿喷。上一篇我们已经找到了需要输入神经网络的数据（也就是observation 是GYM提供的代表一定意义的数，每个游戏不同），和神经网络需要输出的值（也就是action 需要控制游戏的值）

>>阅读原文<<