Q-learning through Flappy Bird

学习https://www.zhihu.com/search?type=content&q=Q-learning的笔记  让小鸟学习怎么飞是一个强化学习的过程,强化学习中有状态 动作 奖赏三个要素,智能体根据状态采取动作,获得奖赏后再去改进这些动作,使下次再到相同的状态,智能体能做出更优的动作。 状态的选择 小鸟到下一根下侧管子的水平距离和垂直距离差 (图片来自原项目) 动作的选择 1 向上飞一下
相关文章
相关标签/搜索