经过简单的强化学习实现井字棋(Tic-Tac-Toe)

1、强化学习简介 强化学习的过程能够理解为Agent与Environment的交互、学习、进步的过程,在井字棋中,能够简单的将其中的一方理解为Agent,另外一方为Environment。交互的过程当中主要有一下4个要素:python 状态(state):指可能出现的状况或局面,在井字棋中指局面上的落子状况与前后手。 操做(action):指从一个状态(state)到另外一个状态(state)的过
相关文章
相关标签/搜索