监督学习,无监督学习和半监督学习

最近在学习的过程当中,我经常会遇到监督学习和非监督学习,所以对这两个概念进行了一下总结,另外又补充了一下半监督学习的概念算法


 机器学习的经常使用方法,主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。监督学习,就是咱们常说的分类,经过已有的训练样本(即已知数据以及其对应的输出)去训练获得一个最优模型,再利用这个最优模型将全部的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具备了对未知数据进行分类的能力。无监督学习(也有人叫非监督学习)则是另外一种研究的比较多的学习方法,它与监督学习的不一样之处,在于咱们事先没有任何训练样本,而须要直接对数据进行建模。无监督学习里典型的例子就是聚类了。聚类的目的在于把类似的东西聚在一块儿,而咱们并不关心这一类是什么。所以,一个聚类算法一般只须要知道如何计算类似度就能够开始工做了。网络






监督学习

监督学习(supervised learning)是指用已经标记好的数据(labelled data),作训练来预测新数据的类型(class),或者是值。预测已有类型叫作分类(classification),预测一个值叫作回归(regression)。机器学习

咱们出生时,懵懵懂懂,能够说什么也不知道,从孩子时开始咱们就被大人们教授这是鸟啊、那是狗啊、那是房子啊,等等。咱们所见到的景物就是输入数据,而大人们对这些景物的判断结果(是房子仍是鸟啊)就是相应的输出。当咱们见识多了之后,脑子里就慢慢地获得了一些泛化的模型,这就是训练获得的那个(或者那些)函数,从而不须要大人在旁边指点的时候,咱们也能分辨的出来哪些是房子,哪些是鸟。函数

监督学习里典型的例子就是KNN、SVM,BP神经网络学习

咱们何时会用到监督学习呢?spa

若是咱们在分类的过程当中有训练样本(training data),则能够考虑用监督学习的方法;若是没有训练样本,则不可能用监督学习的方法。.net


 


无监督学习

无监督学习(unsupervised learning)是指不须要提早对数据作标记,直接对它们作聚类(clustering)。blog

可是在咱们自身认识世界的过程当中不少处都用到了无监督学习。好比咱们去参观一个画展,咱们彻底对艺术一无所知,可是欣赏完多幅做品以后,咱们也能把它们分红不一样的派别(好比哪些更朦胧一点,哪些更写实一些,即便咱们不知道什么叫作朦胧派,什么叫作写实派,可是至少咱们能把他们分为两个类)。开发

 

 


半监督学习

半监督学习(semi-supervised learning)其实就和它的名字同样,同时用了有监督学习的方法和无监督的方法,更准确的说是同时用了标记好的数据(labelled data)和未标记的数据(unlabelled data) 。get

总结上面所说的监督学习用于分类和回归,无监督学习用于聚类,那么半监督学习的目的是什么呢?目的是用现有的数据训练出更好的数据模型。要知道,如今占主导地位的仍是有监督学习,如何更好的利用无监督学习仍是一个正在研究的话题,之因此须要开发他的缘由是咱们不须要人工的给数据打标签,这样会很是省事。从这里能够得知,虽然咱们如今能够有海量的数据,可是其中只有不多一部分是有标签的。因此半监督学习就是要同时利用有标记的数据和没标记的数据。 举个例子:

 

假设上图中红点和蓝点表示两类数据class1,class2。绿点表示没有被标记的数据。若是如今咱们用支持向量机(SVM),仅对有标记的数据分类,那么分割线如左图所示。可是其实真是状况是,若是咱们不忽略为作标记的数据,数据的分布实际上是如右图所示的。那么一个更好的划分线也应该是如右图所示的垂直线。这就是半监督学习的基本原理。


参考连接:https://blog.csdn.net/jwh_bupt/article/details/7654120

                 https://blog.csdn.net/dugudaibo/article/details/79061673

                 https://www.zhihu.com/question/27138263/answer/230490634