强化学习极简例子--井字棋

井字棋 3*3的棋盘上,白、黑子轮流下。如果某方棋子占满同一行、同一列、同一条斜线,则算赢。当棋盘占满还未分出胜负,则为和棋。 棋局状态编码 由于每个位置有三种可能状态:空(0)、白(1)、黑(2),可用3进制来表示棋局当前状态,其中0行0列表示最低位,0行1列表示次低位。 图1. 棋局例 图1所示棋局,用3进制表示为001200210,转化为十进制即 0 × 3 8 + 0 × 3 7 + 1
相关文章
相关标签/搜索