【深度】专业解读“深度强化学习“：从AlphaGo到AlphaGoZero

时间 2020-12-30

原文原文链接

近日，DeepMind在Nature上公布了最新版AlphaGo论文，介绍了迄今为止最强的围棋AI:AlphaGoZero。AlphaGoZero不需要人类专家知识，只使用纯粹的深度强化学习技术和蒙特卡罗树搜索，经过3天自我对弈以100：0击败上一版本AlphaGo。AlphaGoZero证明了深度强化学习的强大能力，这一成果也势必将推动该领域的进一步发展。深度强化学习和AlphaGo 在人工

>>阅读原文<<