OpenCVでニューラルネットワークCvANN_を使用MLP
6517 ワード
原文参照:http://blog.csdn.net/xiaowei_cqu/article/details/9027617
OpenCVのmlモジュールは人工ニューラルネットワーク(Artificial Neural Networks,ANN)の最も典型的な多層センサ(multi-layer perceptrons,MLP)モデルを実現した.mlモデルで実装されたアルゴリズムは,統一されたCvStatModelベースクラスから継承されるため,その訓練と予測のインタフェースはtrain(),predict()であり,非常に簡単である.
ニューラルネットワークCvANNを見てみましょうMLPの使用~
ニューラルネットワークおよびパラメータを定義します.
CvANN_を直接定義できますMLPニューラルネットワークを設定し、そのパラメータを設定します.BACKPROPは、back-propagationを使用するトレーニング方法、RPROP、すなわち最も簡単なpropagationトレーニング方法を表す.
BACKPROPを使用するには、2つの関連パラメータがあります:bp_dw_scaleすなわちbp_moment_scale:
PRPOPを使用するには、rp_の4つの関連パラメータがあります.dw0, rp_dw_plus, rp_dw_minus, rp_dw_min, rp_dw_max:
上記のコードのデフォルト値です.
ネットワーク層数、トレーニングデータを設定します.
LayerSizesには、入力レイヤ、3つの隠しレイヤ、出力レイヤの3つの隠しレイヤが設定されています.入力レイヤと出力レイヤのノード数はいずれも5であり、中間隠蔽レイヤには各レイヤに2つのノードがある.
createの2番目のパラメータは、各ニューラルノードのアクティブ化関数を設定できます.デフォルトはCvANN_です.MLP::SIGMOID_SYM、すなわちSigmoid関数であり、同時に提供される他の活性化関数はGaussおよびステップ関数である.
訓練されたネットワーク構造を使用して、新しいデータを分類します.
次にpredict関数を直接使用すると、新しいノードを予測できます.
完全なプログラムコード:
OpenCVのmlモジュールは人工ニューラルネットワーク(Artificial Neural Networks,ANN)の最も典型的な多層センサ(multi-layer perceptrons,MLP)モデルを実現した.mlモデルで実装されたアルゴリズムは,統一されたCvStatModelベースクラスから継承されるため,その訓練と予測のインタフェースはtrain(),predict()であり,非常に簡単である.
ニューラルネットワークCvANNを見てみましょうMLPの使用~
ニューラルネットワークおよびパラメータを定義します.
//Setup the BPNetwork
CvANN_MLP bp;
// Set up BPNetwork's parameters
CvANN_MLP_TrainParams params;
params.train_method=CvANN_MLP_TrainParams::BACKPROP;
params.bp_dw_scale=0.1;
params.bp_moment_scale=0.1;
//params.train_method=CvANN_MLP_TrainParams::RPROP;
//params.rp_dw0 = 0.1;
//params.rp_dw_plus = 1.2;
//params.rp_dw_minus = 0.5;
//params.rp_dw_min = FLT_EPSILON;
//params.rp_dw_max = 50.;
CvANN_を直接定義できますMLPニューラルネットワークを設定し、そのパラメータを設定します.BACKPROPは、back-propagationを使用するトレーニング方法、RPROP、すなわち最も簡単なpropagationトレーニング方法を表す.
BACKPROPを使用するには、2つの関連パラメータがあります:bp_dw_scaleすなわちbp_moment_scale:
PRPOPを使用するには、rp_の4つの関連パラメータがあります.dw0, rp_dw_plus, rp_dw_minus, rp_dw_min, rp_dw_max:
上記のコードのデフォルト値です.
ネットワーク層数、トレーニングデータを設定します.
// Set up training data
float labels[3][5] = {{0,0,0,0,0},{1,1,1,1,1},{0,0,0,0,0}};
Mat labelsMat(3, 5, CV_32FC1, labels);
float trainingData[3][5] = { {1,2,3,4,5},{111,112,113,114,115}, {21,22,23,24,25} };
Mat trainingDataMat(3, 5, CV_32FC1, trainingData);
Mat layerSizes=(Mat_<int>(1,5) << 5,2,2,2,5);
bp.create(layerSizes,CvANN_MLP::SIGMOID_SYM);//CvANN_MLP::SIGMOID_SYM
//CvANN_MLP::GAUSSIAN
//CvANN_MLP::IDENTITY
bp.train(trainingDataMat, labelsMat, Mat(),Mat(), params);
LayerSizesには、入力レイヤ、3つの隠しレイヤ、出力レイヤの3つの隠しレイヤが設定されています.入力レイヤと出力レイヤのノード数はいずれも5であり、中間隠蔽レイヤには各レイヤに2つのノードがある.
createの2番目のパラメータは、各ニューラルノードのアクティブ化関数を設定できます.デフォルトはCvANN_です.MLP::SIGMOID_SYM、すなわちSigmoid関数であり、同時に提供される他の活性化関数はGaussおよびステップ関数である.
訓練されたネットワーク構造を使用して、新しいデータを分類します.
次にpredict関数を直接使用すると、新しいノードを予測できます.
Mat sampleMat = (Mat_<float>(1,5) << i,j,0,0,0);
Mat responseMat;
bp.predict(sampleMat,responseMat);
完全なプログラムコード:
//The example of using BPNetwork in OpenCV
//Coded by L. Wei
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/ml/ml.hpp>
#include <iostream>
#include <string>
using namespace std;
using namespace cv;
int main()
{
//Setup the BPNetwork
CvANN_MLP bp;
// Set up BPNetwork's parameters
CvANN_MLP_TrainParams params;
params.train_method=CvANN_MLP_TrainParams::BACKPROP;
params.bp_dw_scale=0.1;
params.bp_moment_scale=0.1;
//params.train_method=CvANN_MLP_TrainParams::RPROP;
//params.rp_dw0 = 0.1;
//params.rp_dw_plus = 1.2;
//params.rp_dw_minus = 0.5;
//params.rp_dw_min = FLT_EPSILON;
//params.rp_dw_max = 50.;
// Set up training data
float labels[3][5] = {{0,0,0,0,0},{1,1,1,1,1},{0,0,0,0,0}};
Mat labelsMat(3, 5, CV_32FC1, labels);
float trainingData[3][5] = { {1,2,3,4,5},{111,112,113,114,115}, {21,22,23,24,25} };
Mat trainingDataMat(3, 5, CV_32FC1, trainingData);
Mat layerSizes=(Mat_<int>(1,5) << 5,2,2,2,5);
bp.create(layerSizes,CvANN_MLP::SIGMOID_SYM);//CvANN_MLP::SIGMOID_SYM
//CvANN_MLP::GAUSSIAN
//CvANN_MLP::IDENTITY
bp.train(trainingDataMat, labelsMat, Mat(),Mat(), params);
// Data for visual representation
int width = 512, height = 512;
Mat image = Mat::zeros(height, width, CV_8UC3);
Vec3b green(0,255,0), blue (255,0,0);
// Show the decision regions given by the SVM
for (int i = 0; i < image.rows; ++i)
for (int j = 0; j < image.cols; ++j)
{
Mat sampleMat = (Mat_<float>(1,5) << i,j,0,0,0);
Mat responseMat;
bp.predict(sampleMat,responseMat);
float* p=responseMat.ptr<float>(0);
int response=0;
for(int i=0;i<5;i++){
// cout<<p[i]<<" ";
response+=p[i];
}
if (response >2)
image.at<Vec3b>(j, i) = green;
else
image.at<Vec3b>(j, i) = blue;
}
// Show the training data
int thickness = -1;
int lineType = 8;
circle( image, Point(501, 10), 5, Scalar( 0, 0, 0), thickness, lineType);
circle( image, Point(255, 10), 5, Scalar(255, 255, 255), thickness, lineType);
circle( image, Point(501, 255), 5, Scalar(255, 255, 255), thickness, lineType);
circle( image, Point( 10, 501), 5, Scalar(255, 255, 255), thickness, lineType);
imwrite("result.png", image); // save the image
imshow("BP Simple Example", image); // show it to the user
waitKey(0);
}