监督学习与无监督学习

机器学习若是按照训练样本标签的有无能够分为如下两种经常使用方法。
有监督学习(supervised learning)和无监督学习(unsupervised learning)。web

以机器学习中的分类(classification)来讲,输入的训练数据有特征(feature),有标签(label)。在分类过程当中,若是全部训练数据都有标签,则为有监督学习(supervised learning)。若是数据没有标签,显然就是无监督学习(unsupervised learning)了,也即聚类(clustering)。算法

监督学习,就是经过已有的训练样本(即已知数据以及其对应的输出)去训练获得一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将全部的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具备了对未知数据进行分类的能力。
典型的例子就是KNN、SVM。机器学习

KNN算法:http://www.omegaxyz.com/2018/01/08/knn/?hilite=%27KNN%E7%AE%97%E6%B3%95%27svg

SVM算法:http://www.omegaxyz.com/tag/svm/函数

无监督学习(或者叫非监督学习)则是另外一种。它与监督学习的不一样之处,在于咱们事先没有任何训练样本,而须要直接对数据进行建模。
无监督学习里典型的例子就是聚类了。学习

k-means聚类算法:http://www.omegaxyz.com/2018/01/27/kmeans/?hilite=%27%E8%81%9A%E7%B1%BB%27xml

所以,learning家族的总体构造是这样的:
有监督学习(分类,回归)

半监督学习(分类,回归),transductive learning(分类,回归)

半监督聚类(有标签数据的标签不是肯定的,相似于:确定不是xxx,极可能是yyy)

无监督学习(聚类)get