蒙特卡洛树搜索实现井字棋

蒙特卡洛算法 例子 井字棋实现 1)以当前局面创建根节点 2)棋面剩余位置为子节点 3)因每个子节点访问为0,所以循环模拟每个子节点,然后反向传播,下一步在从根节点根据UCB进行选择,扩展,模拟,反向传播,直到训练结束 4)从当前棋面下用UCB选择下一步棋面进行落子 5)然后重复step1,step2,step3,step4直到游戏结束
相关文章
相关标签/搜索