QUANT[19]强化学习(Reinforcement Learning)学习笔记7

时间 2021-01-02

标签强化学习繁體版

原文原文链接

Reinforcement Learning：An Introduction NOTE[5] 1.5 拓展例子：井字棋为了说明强化学习的一般概念，并与其他方法进行对比，我们接下来将更详细地考虑一个示例。想想我们熟悉的孩子玩的井字棋。棋手在三行三列的棋盘上博弈，一个棋手下X，另一个下O。若X或O的连续三个棋子落于一行或一列或同一斜线上则获胜；若棋盘被填满也不能决出胜负则为平局。让我们假设，我

>>阅读原文<<