フル接続ニューラルネットワークpython実装
10018 ワード
ニューラルネットワークは手書きデジタル識別問題を解決する
ニューラルネットワークは深い学習の基礎であり、その強大なフィッティングと学習能力は、画像認識、人工知能の面で非常に優れている.ここではニューラルネットワークの原理構造を紹介しない.(この部分はネット上で非常に多い)ここでは、筆者が純粋なpythonで書いたニューラルネットワークコードを利用して、sklearnライブラリのdigitsデータセットの識別を実現した.精度は93%以上
コードは次のとおりです.詳細はコードコメントを参照してください.
異種または問題の解決
手書き数字の認識の解決
ニューラルネットワークは深い学習の基礎であり、その強大なフィッティングと学習能力は、画像認識、人工知能の面で非常に優れている.ここではニューラルネットワークの原理構造を紹介しない.(この部分はネット上で非常に多い)ここでは、筆者が純粋なpythonで書いたニューラルネットワークコードを利用して、sklearnライブラリのdigitsデータセットの識別を実現した.精度は93%以上
コードは次のとおりです.詳細はコードコメントを参照してください.
import numpy as np
# tanh
def tanh(x):
return np.tanh(x)
#tanh ,
def tanh_deriv(x):
return 1-np.tanh(x)*np.tanh(x)
#
def logistic(x):
return 1/(1+np.exp(-x))
# logistic
def logistic_deriv(x):
return logistic(x)*(1-logistic(x))
#
class NeuralNetwork:
def __init__(self,layers,activation='tanh'):
# ,
if activation == 'logistic':
self.activation = logistic
self.activation_deriv = logistic_deriv
elif activation == 'tanh':
self.activation = tanh
self.activation_deriv = tanh_deriv
# ,
self.weights = []
for i in range(1 , len(layers)-1):
# shape, 1
self.weights.append((2*np.random.random((layers[i-1]+1,layers[i]+1))-1)*0.25)
# shape, 1
self.weights.append((2*np.random.random((layers[i]+1,layers[i+1]))-1)*0.25)
#fit ,X ,y ,learning_rate
#epochs
def fit(self , X , y , learning_rate=0.2 , epochs=10000):
X = np.atleast_2d(X)# X
temp = np.ones([X.shape[0],X.shape[1]+1])
temp[:,0:-1] = X
X = temp # X 1
y = np.array(y)# y np array
#
for k in range(epochs):
i = np.random.randint(X.shape[0])# 0-epochs
a = [X[i]]# list
#
for l in range(len(self.weights)):
a.append(self.activation(np.dot(a[l],self.weights[l])))
#
error = y[i] - a[-1]
deltas = [error * self.activation_deriv(a[-1])]
# ,
for l in range(len(a)-2,0,-1):
deltas.append(deltas[-1].dot(self.weights[l].T)*self.activation_deriv(a[l]))
deltas.reverse()
#
for i in range(len(self.weights)):
layer = np.atleast_2d(a[i])
delta = np.atleast_2d(deltas[i])
self.weights[i] += learning_rate*layer.T.dot(delta)
#
def predict(self,x):
x = np.array(x)
temp = np.ones(x.shape[0]+1)
temp[0:-1] = x
a = temp
for l in range(0,len(self.weights)):
a = self.activation(np.dot(a,self.weights[l]))
return a
異種または問題の解決
if __name__ == '__main__':
nn = NeuralNetwork([2,2,1],'tanh')
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,0])
nn.fit(X,y)
for i in [[0,0],[0,1],[1,0],[1,1]]:
print i,nn.predict(i)
手書き数字の認識の解決
import numpy as np
from sklearn.datasets import load_digits
from sklearn.metrics import confusion_matrix,classification_report
from sklearn.preprocessing import LabelBinarizer
from sklearn.preprocessing import MinMaxScaler
from sklearn.cross_validation import train_test_split
if __name__ == '__main__':
#
digits = load_digits()
X = digits.data
y = digits.target
# X
X = MinMaxScaler().fit_transform(X)
# 64*100*10 , logistic
nn = NeuralNetwork([64,100,10],'logistic')
X_train,X_test,y_train,y_test = train_test_split(X,y)
#
labels_train = LabelBinarizer().fit_transform(y_train)
labels_test = LabelBinarizer().fit_transform(y_test)
print 'start fitting'
nn.fit(X_train,labels_train,epochs=3000)
predictions = []
for i in range(X_test.shape[0]):
o = nn.predict(X_test[i])
predictions.append(np.argmax(o))//
#
print predictions
#
print confusion_matrix(y_test,predictions)
#
print classification_report(y_test,predictions)