强化学习之概述

什么是强化学习? 面向智能体的学习–经过与一个环境进行交互来实现目标 经过试错和优化进行学习–用试错后的奖励(或惩罚)进行学习 强化学习 vs 其余机器学习 机器学习web 监督学习:有即时标签的学习(如分类,回归等)机器学习 监督学习要求带标签的数据,这些数据是比较昂贵的 标注数据也是一门学问svg 非监督学习:无标签学习(聚类问题等)函数 无标签数据的数量很是庞大且容易得到学习 强化学习:有延
相关文章
相关标签/搜索