【强化学习】AlphaGo Zero论文

AlphaGo Zero论文中文版 :Mastering the game of Go without human knowledge 绪论          长久以来,人工智能的目标是在富有挑战性的领域中学习出一种从无知幼儿到超级专家的算法。最近,AlphaGo已经成为第一个在围棋比赛中打败世界冠军的程序。AlphaGo中的树搜索使用深度神经网络来评估棋局和选择动作。这些神经网络是利用人类专家的
相关文章
相关标签/搜索