学习SVM（四）理解SVM中的支持向量（Support Vector）

时间 2019-11-17

标签学习 svm 理解支持向量 support vector 栏目 Java 繁體版

原文原文链接

咱们在开始接触SVM时确定听到过相似这样的话，决定决策边界的数据叫作支持向量，它决定了margin究竟是多少，而max margin更远的点，其实有没有无所谓。而后通常会配一张图说明一下哪些是支持向量（Support Vector），这个图在以前的学习SVM（二）如何理解支持向量机的最大分类间隔里面就有，这里不在重复贴了。html

可是问题的关键是，这些Support Vector是怎么被肯定的呢？在学习SVM（三）理解SVM中的对偶问题计算获得新的优化目标：函数

注意这里的约束条件有n+1个，以后只须要根据Data（x），Label（y）求解出知足条件的拉格朗日系数a，并将a带回求得w和b，因而就有了最后的决策边界。（w，b，x，y，a都是向量）学习

注意：在上面b的公式中，i=1,2,…,n。可是j却没有给值，这是由于j是任意一个支持向量均可以。优化

在这里对w和b的公式的推导作一个简短说明，w是经过拉格朗日求偏导后推出的；在学习SVM（二）如何理解支持向量机的最大分类间隔中咱们知道最大间隔为：3d

那么支持向量到决策边界的距离为： cdn

同时根据点到直线的距离公式有：htm

超平面（w,b）可以将训练样本正确分类，即对于 blog

所以去掉绝对值能够获得关于b的公式。

而非支持向量的数据就在求解参数a，w，b的过程当中，前面的参数w求得的结果会为0，这样就知足了以前的说法，只有支持向量在影响着决策边界的肯定，举个例子： get

上图中有3个点，x1(3,3)，x2(4,3)，x3(1,1)，对应的：y1=y2=1，y3=-1。很显然x1和x3是两个支持向量，在决策平面的两侧，咱们带入到上面的公式求解一下：因为两个求和公式（n=3），因此括号里面的是项会有9个，能够理解为两个for循环嵌套啊（哈~哈~），可是显然这9项里面是有重复的，由于a1a2 = a2a1，因此最后会剩下6项： a1a1，a2a2，a3a3，2a1a3，2a1a2，2a2a3，举个例子肯定前面的系数： Ca1a2 = [(x1)(x2)y1y2]a1a2 C=2*(3,3)(4,3)(1)=2(12+9)=42it

因此最后的结果以下：