英文原文连接:SVM - Understanding the math - Part 1 - The margin算法
译者注:本人研一,项目缘由须要了解SVM知识,奈何向量相关知识全都还给本科老师,这一部分彻底没看懂,直到看到了国外某博客写的这个SVM系列教程,深刻浅出,只要有初中数学基础便可看懂,特别适合我这样的。因而翻译该系列教程,帮助和我同样经历的同窗早日掌握SVM。学习
全系列目录:spa
小白学SVM系列教程(一)——间隔(margin)翻译
小白学SVM系列教程(二)——向量教程
小白学SVM系列教程(三)——最优超平面ip
这是我写的SVM背后的数学原理系列文章的第一篇。有许多人说要了解SVM,充分的数学背景知识是必要的,不过我将尽可能由浅入深慢慢地讲解,以便每个细节都是清楚明白的,甚至对于初学者来讲也可以理解。get
支持向量机的目标是找出可以最大化训练集数据间隔(margin)的最优分类超平面。博客
首先,咱们可以从定义中看出SVM须要训练数据,也就是说它是一种监督学习算法。数学
知道SVM是一种分类算法也是十分重要的,这意味着咱们将使用它去预测某个东西是否属于特定的类别。it
例如,咱们拥有以下的训练数据:
咱们已经绘制了人群的身高和体重散点图,也用不一样的标记区分了男人和女人。
有了这些数据,咱们将可以使用SVM回答下面几个问题:
给定一个具体的数据点(身高和体重),这我的是男人仍是女人?
例如:若是知道某人身高175cm体重80kg,这我的是男人仍是女人?
经过观察上图,咱们可以发现分类这些数据是可能的。例如,咱们能够描绘一条直线而后全部表明男人的点都在直线的上边,表明女人的点都在直线的下边。
这条直线被称为分类超平面,以下图所示:
若是它就是一条线,为何咱们称它为超平面呢?
超平面是平面的抽象。
在一维空间,超平面是一个点
在二维空间,它是一条线
在三位空间,它是一个面
在更高维度上,你可以称它为超平面
在一维空间中,点L是一个分类超平面。
你可以找到一个分类超平面,但这并不意味着它是最好的那个!在下面的例子中有几个分类超平面,每一个都成功地将咱们的数据集分类为男人和女人两部分。
存在许多的分类超平面
假设咱们选择绿色的超平面而且使用它给真实数据分类。
这个超平面并不可以很好的分类数据。
此次,它分类出现了错误。明显,咱们可以看出,若是咱们选择了一个靠近某一类数据点的超平面,它也许并不能很好地分类数据。
所以咱们将会尝试选择一个尽量远离每一种类别数据点的超平面:
这一个看起来更好。当咱们用它分类真实数据中时,它仍然进行了完美的分类。
黑色的超平面比绿色的超平面分类更准确。
这就是为何SVM的目标是寻找最优分类超平面:
由于它可以正确地分类训练数据
同时由于它能更准确地分类还没有出现的数据。
咱们的最优超平面的间隔
给定一个超平面,咱们可以计算出超平面到最近的一个点的距离。一旦咱们算出这个值,若是咱们将距离乘以2咱们就能够获得间隔(margin)。
基本上,间隔是一个“无人区”。在间隔内不存在任何数据点。
对于另外一个超平面,间隔将看起来像这样:
如图所示,间隔B比间隔A小得多。
咱们可以观察到如下结果:
若是一个超平面十分接近某个数据点,它的间隔将很小
超平面距离数据点越远,间隔就越大
这意味着最优超平面将是拥有最大边距的那个超平面。
这也是为何SVM的目标是找到最大化训练集数据间隔的最优分类超平面。
到这里关于SVM背后的数学原理的介绍就结束了,目前没有有多少公式,可是在下篇文章咱们将增长一些数字而后试着从数学的视角(几何和向量)来进行理解。