机器学习过程:根据训练样本获得模型,再用真实数据输入结果获得标记空间(又称输出空间)。通常地,预测任务是但愿经过对训练空间((x1,y1),(x2,y2),.....(xn,yn)) 进行学习,创建一个从输入控件X到输出空间Y的映射f:x->y。算法
若咱们预测的是离散值,此类学习任务被称为“分类”Classification; 若咱们预测的是连续值,此类学习任务被称为“回归”regression; =机器学习
咱们还能够对西瓜作聚类Clustering,便是对训练集中的西瓜分红若干组,每组成为一个簇,这些自动造成的簇可能对应一些潜在的概念划分。好比浅色瓜,本地瓜。其中浅色瓜和本地瓜这些概念咱们是事先不知道的,并且学习过程当中使用的训练样本一般不用有标记信息,这样的学习过程有助于咱们理解数据内在规律。学习
监督学习supervised learning=分类和回归io
无监督学习unsupervised learning=聚类sed
对学得模型适用于新样本的能力,成为泛化能力。学习算法自身的概括偏好与问题是否匹配,每每会对结果起到决定性做用。数据
过拟合:学习器把训练训练样本自己一些特色看成了全部潜在样本都会有的通常性质,就是过拟合。vi