机器学习算法——强化学习

2016 年 3 月,谷歌公司 DeepMind 团队的 AlphaGo 以 4 比 1 战胜第 18 届世界围棋冠军李世石,这是一场具有历史意义的比赛。 图 1 围棋落子位置种类 让电脑学会下围棋是一件十分困难的事情,它有如图 1 所示这么多种可能的落子位置。在围棋中获胜不可能只靠简单的蛮力,它需要技巧、创造力,以及类似职业棋手的直觉。 通过融合深度强化学习网络和最先进的树搜索算法,AlphaG
相关文章
相关标签/搜索