300字范文 > 支持向量机 (SVM)分类器原理分析与基本应用

支持向量机 (SVM)分类器原理分析与基本应用

时间：2018-08-04 13:25:07

转自：穆晨

阅读目录

前言预备术语算法原理如何计算最优超平面使用SMO - 高效优化算法求解α 值非线性可分情况的大致解决思路小结回到顶部

前言

支持向量机，也即SVM，号称分类算法，甚至机器学习界老大哥。其理论优美，发展相对完善，是非常受到推崇的算法。

本文将讲解的SVM基于一种最流行的实现 - 序列最小优化，也即SMO。

另外还将讲解将SVM扩展到非线性可分的数据集上的大致方法。

回到顶部

预备术语

1. 分割超平面：就是决策边界

2. 间隔：样本点到分割超平面的距离

3. 支持向量：离分割超平面距离最近的样本点

回到顶部

算法原理

在前一篇文章 - 逻辑回归中，讲到了通过拟合直线来进行分类。

而拟合的中心思路是求错误估计函数取得最小值，得到的拟合直线是到各样本点距离和最小的那条直线。

然而，这样的做法很多时候未必是最合适的。

请看下图：

一般来说，逻辑回归得到的直线线段会是B或者C这样的形式。而很显然，从分类算法的健壮性来说，D才是最佳的拟合线段。

SVM分类算法就是基于此思想：找到具有最小间隔的样本点，然后拟合出一个到这些样本点距离和最大的线段/平面。

回到顶部

如何计算最优超平面

1. 首先根据算法思想 - "找到具有最小间隔的样本点，然后拟合出一个到这些样本点距离和最大的线段/平面。" 写出目标函数：

该式子的解就是待求的回归系数。

然而，这是一个嵌套优化问题，非常难进行直接优化求解。为了解这个式子，还需要以下步骤。

2. 不去计算内层的min优化，而是将距离值界定到一个范围 - 大于1，即最近的样本点，也即支持向量到超平面的距离为1。下图可以清楚表示这个意思：

去掉min操作，代之以界定：label * (wTx + b) >= 1。

3. 这样得到的式子就是一个带不等式的优化问题，可以采用拉格朗日乘子法(KKT条件)去求解。

具体步骤推论本文不给出。推导结果为：

另外，可加入松弛系数 C，用于控制 "最大化间隔" 和"保证大部分点的函数间隔小于1.0" 这两个目标的权重。

将 α >= 0 条件改为 C >= α >= 0 即可。

α 是用于求解过程中的一个向量，它和要求的结果回归系数是一一对应的关系。

将其中的 α 解出后，便可依据如下两式子(均为推导过程中出现的式子)进行转换得到回归系数：

说明: 要透彻理解完整的数学推导过程需要一些时间，可参考某位大牛的文章/v_july_v/article/details/7624837。

回到顶部

使用SMO - 高效优化算法求解α 值

算法思想：

每次循环中选择两个α 进行优化处理。一旦找到一对合适的 α，那么就增大其中一个减小另外一个。

所谓合适，是指必须符合两个条件：1. 两个α 值必须要在α 分隔边界之外 2. 这两个α 还没有进行过区间化处理或者不在边界上。

使用SMO求解 α 伪代码：

1 创建一个 alpha 向量并将其初始化为全02 当迭代次数小于最大迭代次数(外循环):3对数据集中的每个向量(内循环):4 如果该数据向量可以被优化5 随机选择另外一个数据向量6 同时优化这两个向量7 如果都不能被优化，推出内循环。8如果所有向量都没有被优化，则增加迭代数目，继续下一次的循环。

实现及测试代码：

1 #!/usr/bin/env python2 # -*- coding:UTF-8 -*-3 4 '''5 Created on 20**-**-**6 7 @author: fangmeng8 '''9 10 from numpy import *11 from time import sleep12 13 #=====================================14 # 输入：15 # fileName: 数据文件16 # 输出:17 # dataMat: 测试数据集18 # labelMat: 测试分类标签集19 #=====================================20 def loadDataSet(fileName):21'载入数据'2223dataMat = []; labelMat = []24fr = open(fileName)25for line in fr.readlines():26 lineArr = line.strip().split('\t')27 dataMat.append([float(lineArr[0]), float(lineArr[1])])28 labelMat.append(float(lineArr[2]))29return dataMat,labelMat30 31 #=====================================32 # 输入：33 # i: 返回结果不等于该参数34 # m: 指定随机范围的参数35 # 输出:36 # j: 0-m内不等于i的一个随机数37 #=====================================38 def selectJrand(i,m):39'随机取数'4041j=i42while (j==i):43 j = int(random.uniform(0,m))44return j45 46 #=====================================47 # 输入：48 # aj: 数据对象49 # H: 数据对象最大值50 # L: 数据对象最小值51 # 输出:52 # aj: 定界后的数据对象。最大H 最小L53 #=====================================54 def clipAlpha(aj,H,L):55'为aj定界'5657if aj > H: 58 aj = H59if L > aj:60 aj = L61return aj62 63 #=====================================64 # 输入：65 # dataMatIn: 数据集66 # classLabels: 分类标签集67 # C: 松弛参数68 # toler: 荣错率69 # maxIter: 最大循环次数70 # 输出:71 # b: 偏移72 # alphas: 拉格朗日对偶因子73 #=====================================74 def smoSimple(dataMatIn, classLabels, C, toler, maxIter):75'SMO算法求解alpha'7677# 数据格式转化78dataMatrix = mat(dataMatIn); 79labelMat = mat(classLabels).transpose()80m,n = shape(dataMatrix)81alphas = mat(zeros((m,1)))828384iter = 0 85b = 086while (iter < maxIter):87 # alpha 改变标记88 alphaPairsChanged = 089 90 # 对所有数据集91 for i in range(m):92 # 预测结果93 fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b94 # 预测结果与实际的差值95 Ei = fXi - float(labelMat[i])96 # 如果差值太大则进行优化97 if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):98 # 随机选择另外一个样本99 j = selectJrand(i,m)100 # 计算另外一个样本的预测结果以及差值101 fXj = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b102 Ej = fXj - float(labelMat[j])103 # 暂存当前alpha值对104 alphaIold = alphas[i].copy(); 105 alphaJold = alphas[j].copy();106 # 确定alpha的最大最小值107 if (labelMat[i] != labelMat[j]):108 L = max(0, alphas[j] - alphas[i])109 H = min(C, C + alphas[j] - alphas[i])110 else:111 L = max(0, alphas[j] + alphas[i] - C)112 H = min(C, alphas[j] + alphas[i])113 if L==H: 114 pass115 # eta为alphas[j]的最优修改量116 eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T117 if eta >= 0:118 print "eta>=0"; continue119 # 订正alphas[j]120 alphas[j] -= labelMat[j]*(Ei - Ej)/eta121 alphas[j] = clipAlpha(alphas[j],H,L)122 # 如果alphas[j]发生了轻微变化123 if (abs(alphas[j] - alphaJold) < 0.00001): 124 continue125 # 订正alphas[i]126 alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])127 128 # 订正b129 b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T130 b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T131 if (0 < alphas[i]) and (C > alphas[i]): b = b1132 elif (0 < alphas[j]) and (C > alphas[j]): b = b2133 else: b = (b1 + b2)/2.0134 135 # 更新修改标记参数136 alphaPairsChanged += 1137 138 if (alphaPairsChanged == 0): iter += 1139 else: iter = 0140 141return b,alphas142143 def test():144'测试'145146dataArr, labelArr = loadDataSet('/home/fangmeng/testSet.txt')147b, alphas = smoSimple(dataArr, labelArr, 0.6, 0.001, 40)148print b149print alphas[alphas>0]150151 152 if __name__ == '__main__':153test()

其中，testSet.txt数据文件格式为三列，前两列特征，最后一列分类结果。

测试结果：

结果具有随机性，多次运行的结果不一定一致。

得到 alphas 数组和 b 向量就能直接算到回归系数了，参考上述代码 93 行，稍作变换即可。

回到顶部