没有公式、没有代码,文科生也能看懂的AI大热方向【强化学习】基本原理 || 自动控制、围棋、AlphaGo核心算法:强化学习

不用公式、不用代码,白话讲讲强化学习原理 The best way to learn is to teach others. 近年来,强化学习在围棋等棋牌项目、星际争霸等电脑游戏、机器人玩魔方等自动控制领域颇有建树,那么其核心原理是什么呢?笔者这里用白话谈谈心得。 在说强化学习之前,我们先来聊聊他的两个兄弟:监督学习和无监督学习。 监督学习 监督学习就是,你喂给机器一堆有标签的数据,比如下表这样。
相关文章
相关标签/搜索