支持向量机(SVM)(三)— 最优间隔分类器(optimal margin classifier)

来源:http://blog.csdn.net/u011067360/article/details/25322637

在之前为了寻找最有分类器,我们提出了如下优化问题:

3.3. 最优间隔分类器  - 图1

在这里我们可以把约束条件改写成如下:

3.3. 最优间隔分类器  - 图2

首先我们看下面的图示:

3.3. 最优间隔分类器  - 图3

很显然我们可以看出实线是最大间隔超平面,假设×号的是正例,圆圈的是负例。在虚线上的点和在实线上面的两个一共这三个点称作支持向量。现在我们结合KKT条件分析下这个图。

3.3. 最优间隔分类器  - 图4

我们从式子3.3. 最优间隔分类器  - 图5和式子3.3. 最优间隔分类器  - 图6可以看出如果3.3. 最优间隔分类器  - 图7那么3.3. 最优间隔分类器  - 图8

这个也就说明3.3. 最优间隔分类器  - 图9时,w处于可行域的边界上,这时才是起作用的约束。

1、那我们现在可以构造拉格朗日函数如下:

3.3. 最优间隔分类器  - 图10

注意到这里只有3.3. 最优间隔分类器  - 图113.3. 最优间隔分类器  - 图12是因为原问题中没有等式约束,只有不等式约束。

2、接下来我们对w和b分别求偏导数。

3.3. 最优间隔分类器  - 图13

3.3. 最优间隔分类器  - 图14

并得到

3.3. 最优间隔分类器  - 图15

3、将上式带回到拉格朗日函数中得到:

3.3. 最优间隔分类器  - 图16

由于3.3. 最优间隔分类器  - 图17,因此简化为

3.3. 最优间隔分类器  - 图18

4、现在我们得到了关于w和b的可以最小化的等式,我们在联合3.3. 最优间隔分类器  - 图19这个参数,当然他的条件还3.3. 最优间隔分类器  - 图20>=0,现在我们可以得到如下的二元优化等式了:

3.3. 最优间隔分类器  - 图21

5、现在你还必须知道我们之前讲解的条件一是3.3. 最优间隔分类器  - 图22,二是KKT条件:

3.3. 最优间隔分类器  - 图23

很显然存在w使得对于所有的i3.3. 最优间隔分类器  - 图24。因此,一定存3.3. 最优间隔分类器  - 图25使3.3. 最优间隔分类器  - 图26是原问题的解3.3. 最优间隔分类器  - 图27是对偶问题的解。

如果求出3.3. 最优间隔分类器  - 图28(也就是3.3. 最优间隔分类器  - 图29),根据

3.3. 最优间隔分类器  - 图30

即可求出w(也是3.3. 最优间隔分类器  - 图31,原问题的解)。然后

3.3. 最优间隔分类器  - 图32

即可求出b。即离超平面最近的正的函数间隔要等于离超平面最近的负的函数间隔。

6、现在我们在看另外一个问题:

3.3. 最优间隔分类器  - 图33

3.3. 最优间隔分类器  - 图34

这里我们将向量内3.3. 最优间隔分类器  - 图35表示3.3. 最优间隔分类器  - 图36

现在可以看出我要计算等式的话就只需要计算向量的内积就好了,同时要3.3. 最优间隔分类器  - 图37 在支持向量上面的话,那3.3. 最优间隔分类器  - 图38,这样就更简单了,因此很多的值都是0。

原文: https://wizardforcel.gitbooks.io/dm-algo-top10/content/svm-3.html