py2.7:『機械学習実戦』SVMサポートベクトルマシン:1.26号6-1 SMOアルゴリズム簡略化版


概念:SMO(Sequential Minimal Optimization)はSVM問題を解くLagrange対偶問題に対して二次計画式で開発された効率的なアルゴリズムである.従来の二次計画アルゴリズムの計算オーバーヘッドは訓練セットの規模に比例し,SMOは問題そのものの特性(KKT条件制約)に基づいてこの特殊な二次計画問題の解法過程を最適化した.対偶問題で我々が最後に解いた変数はLagrange乗子ベクトルのみであり,このアルゴリズムの基本思想は毎回1対のみを選択し,ベクトルの他の次元の要素の値を固定し,収束するまで最適化することである.
6-1:SMOアルゴリズムにおける補助関数:
# -*- coding: utf-8 -*-
from numpy import *
import operator
def loadDataSet(filename): #    
    dataMat = [] ; labelMat = [] #      
    fr = open(filename)
    for line in fr.readlines():
        lineArr = line.strip().split('\t') #         ,    
        dataMat.append([float(lineArr[0]),float(lineArr[1])]) #       dataMat
        labelMat.append((float(lineArr[2])))#     labelMat
    return dataMat,labelMat

def selectJrand(i,m):#            ,i alpha   ,m alpha   
    j = i
    while(j==i):#           i    ,      ∑alpha(i)*label(i)=0,      alpha
        j = int(random.uniform(0,m))
    return j

def clipAlpha(aj,H,L):#      H   L alpha 
    if aj>H:
        aj = H
    if L > aj:
        aj = L
    return aj



出力関数:
import SVM
dataArr , labelArr = SVM.loadDataSet('testSet.txt')
print labelArr

効果:
[-1.0, -1.0, 1.0, -1.0, 1.0, 1.0, 1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, 1.0...
ここでlabelsは1と-16-2の簡略化版SMOアルゴリズムであることがわかる.
def smoSimple(dataMatIn, classLabels, C, toler, maxIter)::#   ,    ,  C,   ,          
    dataMatrix = mat(dataMatIn); labelMat = mat(classLabels).transpose()#   numpy  
    b = 0; m,n = shape(dataMatrix)#    
    alphas = mat(zeros((m,1)))# alpha     0
    iter = 0#    alpha            
    while (iter < maxIter):#             
        alphaPairsChanged = 0#    alpha     
        for i in range(m): # m       
            fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b#     
            Ei = fXi - float(labelMat[i])#  Ei
            #       ,             alpha    
            if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
            #  if  ,         ,    alpha ,       0 C
                j = selectJrand(i,m)#     alpha
                fXj = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b
                Ej = fXj - float(labelMat[j])
                alphaIold = alphas[i].copy(); alphaJold = alphas[j].copy();#   alpha  ,           alphas  
                if (labelMat[i] != labelMat[j]):#         ,  alpha 0~C  
                    L = max(0, alphas[j] - alphas[i])
                    H = min(C, C + alphas[j] - alphas[i])
                else:
                    L = max(0, alphas[j] + alphas[i] - C)
                    H = min(C, alphas[j] + alphas[i])
                if L==H: print "L==H"; continue
                #  alpha[j]      
                eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T
                if eta >= 0: print "eta>=0"; continue
                alphas[j] -= labelMat[j]*(Ei - Ej)/eta
                alphas[j] = clipAlpha(alphas[j],H,L)#  alpha   
                if (abs(alphas[j] - alphaJold) < 0.00001): print "j not moving enough"; continue#  alpha[j]
                alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j]# i    ,    j  ,     
                b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T
                b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T
                if (0 < alphas[i]) and (C > alphas[i]): b = b1
                elif (0 < alphas[j]) and (C > alphas[j]): b = b2
                else: b = (b1 + b2)/2.0
                alphaPairsChanged += 1
                print "iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged)
        if (alphaPairsChanged == 0): iter += 1
        else: iter = 0
        print "iteration number: %d" % iter
    return b,alphas

実行には時間がかかります
import SVM
dataArr , labelArr = SVM.loadDataSet('testSet.txt')
b,alphas = SVM.smoSimple(dataArr,labelArr,0.6,0.001,40)
print b
print alphas[alphas>0] #     0        0