Python手写强化学习Q-learning算法玩井字棋

时间 2020-05-23

标签 python 手写强化学习 learning 算法井字栏目 Python 繁體版

原文原文链接

Q-learning 是强化学习中的一种常见的算法，近年来因为深度学习革命而取得了很大的成功。本教程不会解释什么是深度 Q-learning，但咱们将经过 Q-learning 算法来使得代理学习如何玩 tic-tac-toe 游戏。尽管它很简单，但咱们将看到它能产生很是好的效果。html 要理解本教程，没必要有任何关于强化学习的知识，但最好有必定的微积分和线性代数基础。首先，咱们将经过一些必要的

>>阅读原文<<