没有公式、没有代码，文科生也能看懂的AI大热方向【强化学习】基本原理 || 自动控制、围棋、AlphaGo核心算法：强化学习

时间 2021-01-14

标签 Reinforcement Learning Amazing-Brick 繁體版

原文原文链接

不用公式、不用代码，白话讲讲强化学习原理 The best way to learn is to teach others. 近年来，强化学习在围棋等棋牌项目、星际争霸等电脑游戏、机器人玩魔方等自动控制领域颇有建树，那么其核心原理是什么呢？笔者这里用白话谈谈心得。在说强化学习之前，我们先来聊聊他的两个兄弟：监督学习和无监督学习。监督学习监督学习就是，你喂给机器一堆有标签的数据，比如下表这样。

>>阅读原文<<