QUANT[19]强化学习(Reinforcement Learning)学习笔记7

Reinforcement Learning:An Introduction NOTE[5] 1.5 拓展例子:井字棋 为了说明强化学习的一般概念,并与其他方法进行对比,我们接下来将更详细地考虑一个示例。 ​ 想想我们熟悉的孩子玩的井字棋。棋手在三行三列的棋盘上博弈,一个棋手下X,另一个下O。若X或O的连续三个棋子落于一行或一列或同一斜线上则获胜;若棋盘被填满也不能决出胜负则为平局。让我们假设,我
相关文章
相关标签/搜索