深度学习笔记——理论与推导之Reinforcement Learning(十三)

Reinforcement Learning(强化学习) Reinforcement Learning 机器学习的分支: 有监督学习是机器学习任务的一种,它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。即:给定数据,预测标签。 无监督学习是机器学习任务的一种,它从无标记的训练数据中推断结论。最典型的无监督学习就是聚类分析,它可以在探索性数据分析阶段用于
相关文章
相关标签/搜索