【深度】专业解读“深度强化学习“:从AlphaGo到AlphaGoZero

近日,DeepMind在Nature上公布了最新版AlphaGo论文,介绍了迄今为止最强的围棋AI:AlphaGoZero。AlphaGoZero不需要人类专家知识,只使用纯粹的深度强化学习技术和蒙特卡罗树搜索,经过3天自我对弈以100:0击败上一版本AlphaGo。AlphaGoZero证明了深度强化学习的强大能力,这一成果也势必将推动该领域的进一步发展。  深度强化学习和AlphaGo 在人工
相关文章
相关标签/搜索