Muzero算法研读报告

面试的时候被要求了解muzero相关算法,本文根据Julian 等人在2020年发表的”Mastering Atari, Go, Chess and Shogi by Planning with a Learned Mode” 一文,研读并汇报了文中的Muzero算法。相对于Alpha zero, Muzero无需预先了解游戏的游戏规则,比如在棋盘游戏中,只需要去告知哪一步的移动是被允许的,就可以
相关文章
相关标签/搜索