深度学习笔记——理论与推导之Reinforcement Learning（十三）

时间 2021-01-12

标签深度学习繁體版

原文原文链接

Reinforcement Learning（强化学习） Reinforcement Learning 机器学习的分支：有监督学习是机器学习任务的一种，它从有标记的训练数据中推导出预测函数。有标记的训练数据是指每个训练实例都包括输入和期望的输出。即：给定数据，预测标签。无监督学习是机器学习任务的一种，它从无标记的训练数据中推断结论。最典型的无监督学习就是聚类分析，它可以在探索性数据分析阶段用于

>>阅读原文<<