机器学习算法——强化学习

时间 2020-12-30

原文原文链接

2016 年 3 月，谷歌公司 DeepMind 团队的 AlphaGo 以 4 比 1 战胜第 18 届世界围棋冠军李世石，这是一场具有历史意义的比赛。图 1 围棋落子位置种类让电脑学会下围棋是一件十分困难的事情，它有如图 1 所示这么多种可能的落子位置。在围棋中获胜不可能只靠简单的蛮力，它需要技巧、创造力，以及类似职业棋手的直觉。通过融合深度强化学习网络和最先进的树搜索算法，AlphaG

>>阅读原文<<