强化学习之Q-learning

Q-learning浅析 当前的机器学习主流方向包含监督学习、无监督学习、强化学习,这里以一个简单的例子讲解强化学习的入门算法Q-learning。 假设有这样的连通图,图中的0、1、2、3、4、5是状态,有向箭头表示可以从一个状态到另一个状态。在此,玩一个游戏,假设玩家agent在任何一个状态,让他自己走动,走到状态5,就赢了。 在玩游戏的过程中,对于玩家每次的行动系统回给出反馈,这样玩家才能学
相关文章
相关标签/搜索