强化学习之Q-learning

时间 2021-01-01

原文原文链接

Q-learning浅析当前的机器学习主流方向包含监督学习、无监督学习、强化学习，这里以一个简单的例子讲解强化学习的入门算法Q-learning。假设有这样的连通图，图中的0、1、2、3、4、5是状态，有向箭头表示可以从一个状态到另一个状态。在此，玩一个游戏，假设玩家agent在任何一个状态，让他自己走动，走到状态5，就赢了。在玩游戏的过程中，对于玩家每次的行动系统回给出反馈，这样玩家才能学

>>阅读原文<<