Keras强化学习练手——FlappyBird

Document keras强化学习——FlappyBird 运行过程 main.py中train()函数定义好网络和回调函数。 变量 参数 网络 net 预测函数 func = Model(net.input[0], net.out1) 强化学习有5个元素:环境,代理,状态,激励函数(reward),动作。 代理产生动作,环境根据动作反馈该动作之后的环境状态以及reward。需要注意该State
相关文章
相关标签/搜索