框架处理--机器学习术语

时间 2019-11-20

标签框架处理机器学习术语繁體版

原文原文链接

机器学习主要术语

机器学习系统经过学习如何组合输入信息来对从未见过的数据作出有用的预测。机器学习

在简单的线性回归中，特征是输入变量，即x变量。简单的机器学习项目可能会使用单个特征，而比较复杂的机器学习项目可能会使用数万个特征，按照以下方式指定：google

\{x_1, x_2, ... x_N\}

在垃圾邮件检测器示例中，特征可能包括：code

样本是指数据的特定实例：X。（咱们采用粗体表示他是一个矢量。）咱们将样本分为如下两类：生命周期

有标签样本同时包含特征和标签。即：图片

labeled examples: {features, label}: (x, y)

咱们使用有标签样原本训练模型。在咱们的垃圾邮件检测器示例中，有标签样本是用户明确标记为“垃圾邮件”和“非垃圾邮件”的各个电子邮件。get

例如，下表显示了从包含加利福尼亚州房价信息的数据集中抽取的五个有标签样本：table

housingMedianAge （特征）	totalRooms （特征）	totalBedrooms （特征）	medianHouseValue （标签）
15	5612	1283	66900
19	7650	1901	80100
17	720	174	85700
14	1501	337	73400
20	1454	326	65500

无标签样本包含特征，可是不包含标签。即：class

unlabeled examples: {features, ?}: (x, ?)

模型定义了特征与标签之间的关系。例如，垃圾邮件监测模型可能会将某些特征与“垃圾邮件”紧密联系起来。模型生命周期的两个重要阶段：音频

分类模型能够预测离散值。例如，分类模型能够作出的预测可回答以下问题：

回归模型能够预测连续值。例如，回归模型作出的预测能够回答以下问题：