28 天自制你的 AlphaGo(五):蒙特卡洛树搜索(MCTS)基础

蒙特卡洛树搜索(MCTS)是所有现代围棋程序的核心组件。在此之上可以加入各种小技巧(如 UCT,RAVE/AMAF,Progressive Bias,Virtual win & lose,Progressive Widening,LGR,Criticality 等等)和大改进(如 AlphaGo 的策略网络和价值网络)。 网上很少见到关于 MCTS 的详细介绍,而且许多看似详细的介绍实际有错误,甚
相关文章
相关标签/搜索