机器学习（三十七）——Integrating Learning and Planning（3）

时间 2021-01-02

原文原文链接

Integrating Learning and Planning Monte-Carlo Search（续）下面我们结合实例（下围棋）和示意图，来实际了解MCTS的运作过程。第一次迭代：五角形表示的状态是个体第一次访问的状态，也是第一次被录入搜索树的状态。我们构建搜索树：将当前状态录入搜索树中。使用基于蒙特卡罗树搜索的策略（两个阶段），由于当前搜索树中只有当前状态，全程使用的应该是一个搜索第

>>阅读原文<<