OpenCVでニューラルネットワークCvANN_を使用MLP

6517 ワード

原文参照:http://blog.csdn.net/xiaowei_cqu/article/details/9027617
OpenCVのmlモジュールは人工ニューラルネットワーク(Artificial Neural Networks,ANN)の最も典型的な多層センサ(multi-layer perceptrons,MLP)モデルを実現した.mlモデルで実装されたアルゴリズムは,統一されたCvStatModelベースクラスから継承されるため,その訓練と予測のインタフェースはtrain(),predict()であり,非常に簡単である.
ニューラルネットワークCvANNを見てみましょうMLPの使用~
ニューラルネットワークおよびパラメータを定義します.
 
//Setup the BPNetwork
	CvANN_MLP bp; 
	// Set up BPNetwork's parameters
	CvANN_MLP_TrainParams params;
	params.train_method=CvANN_MLP_TrainParams::BACKPROP;
	params.bp_dw_scale=0.1;
	params.bp_moment_scale=0.1;
	//params.train_method=CvANN_MLP_TrainParams::RPROP;
	//params.rp_dw0 = 0.1; 
	//params.rp_dw_plus = 1.2; 
	//params.rp_dw_minus = 0.5;
	//params.rp_dw_min = FLT_EPSILON; 
	//params.rp_dw_max = 50.; 

CvANN_を直接定義できますMLPニューラルネットワークを設定し、そのパラメータを設定します.BACKPROPは、back-propagationを使用するトレーニング方法、RPROP、すなわち最も簡単なpropagationトレーニング方法を表す.
BACKPROPを使用するには、2つの関連パラメータがあります:bp_dw_scaleすなわちbp_moment_scale:
OpenCV中使用神经网络 CvANN_MLP_第1张图片
PRPOPを使用するには、rp_の4つの関連パラメータがあります.dw0, rp_dw_plus, rp_dw_minus, rp_dw_min, rp_dw_max:
上記のコードのデフォルト値です.
ネットワーク層数、トレーニングデータを設定します.
 
// Set up training data
	float labels[3][5] = {{0,0,0,0,0},{1,1,1,1,1},{0,0,0,0,0}};
	Mat labelsMat(3, 5, CV_32FC1, labels);

	float trainingData[3][5] = { {1,2,3,4,5},{111,112,113,114,115}, {21,22,23,24,25} };
	Mat trainingDataMat(3, 5, CV_32FC1, trainingData);
	Mat layerSizes=(Mat_<int>(1,5) << 5,2,2,2,5);
	bp.create(layerSizes,CvANN_MLP::SIGMOID_SYM);//CvANN_MLP::SIGMOID_SYM
	                                           //CvANN_MLP::GAUSSIAN
	                                           //CvANN_MLP::IDENTITY
	bp.train(trainingDataMat, labelsMat, Mat(),Mat(), params);

  
LayerSizesには、入力レイヤ、3つの隠しレイヤ、出力レイヤの3つの隠しレイヤが設定されています.入力レイヤと出力レイヤのノード数はいずれも5であり、中間隠蔽レイヤには各レイヤに2つのノードがある.
 
createの2番目のパラメータは、各ニューラルノードのアクティブ化関数を設定できます.デフォルトはCvANN_です.MLP::SIGMOID_SYM、すなわちSigmoid関数であり、同時に提供される他の活性化関数はGaussおよびステップ関数である.
OpenCV中使用神经网络 CvANN_MLP_第2张图片
訓練されたネットワーク構造を使用して、新しいデータを分類します.
次にpredict関数を直接使用すると、新しいノードを予測できます.
 
Mat sampleMat = (Mat_<float>(1,5) << i,j,0,0,0);
			Mat responseMat;
			bp.predict(sampleMat,responseMat);

  
 
 
完全なプログラムコード:
//The example of using BPNetwork in OpenCV
//Coded by L. Wei
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/ml/ml.hpp>
#include <iostream>
#include <string>

using namespace std;
using namespace cv;

int main()
{
	//Setup the BPNetwork
	CvANN_MLP bp; 
	// Set up BPNetwork's parameters
	CvANN_MLP_TrainParams params;
	params.train_method=CvANN_MLP_TrainParams::BACKPROP;
	params.bp_dw_scale=0.1;
	params.bp_moment_scale=0.1;
	//params.train_method=CvANN_MLP_TrainParams::RPROP;
	//params.rp_dw0 = 0.1; 
	//params.rp_dw_plus = 1.2; 
	//params.rp_dw_minus = 0.5;
	//params.rp_dw_min = FLT_EPSILON; 
	//params.rp_dw_max = 50.;

	// Set up training data
	float labels[3][5] = {{0,0,0,0,0},{1,1,1,1,1},{0,0,0,0,0}};
	Mat labelsMat(3, 5, CV_32FC1, labels);

	float trainingData[3][5] = { {1,2,3,4,5},{111,112,113,114,115}, {21,22,23,24,25} };
	Mat trainingDataMat(3, 5, CV_32FC1, trainingData);
	Mat layerSizes=(Mat_<int>(1,5) << 5,2,2,2,5);
	bp.create(layerSizes,CvANN_MLP::SIGMOID_SYM);//CvANN_MLP::SIGMOID_SYM
	                                           //CvANN_MLP::GAUSSIAN
	                                           //CvANN_MLP::IDENTITY
	bp.train(trainingDataMat, labelsMat, Mat(),Mat(), params);


	// Data for visual representation
	int width = 512, height = 512;
	Mat image = Mat::zeros(height, width, CV_8UC3);
	Vec3b green(0,255,0), blue (255,0,0);
	// Show the decision regions given by the SVM
	for (int i = 0; i < image.rows; ++i)
		for (int j = 0; j < image.cols; ++j)
		{
			Mat sampleMat = (Mat_<float>(1,5) << i,j,0,0,0);
			Mat responseMat;
			bp.predict(sampleMat,responseMat);
			float* p=responseMat.ptr<float>(0);
			int response=0;
			for(int i=0;i<5;i++){
			//	cout<<p[i]<<" ";
				response+=p[i];
			}
			if (response >2)
				image.at<Vec3b>(j, i)  = green;
			else  
				image.at<Vec3b>(j, i)  = blue;
		}

		// Show the training data
		int thickness = -1;
		int lineType = 8;
		circle(	image, Point(501,  10), 5, Scalar(  0,   0,   0), thickness, lineType);
		circle(	image, Point(255,  10), 5, Scalar(255, 255, 255), thickness, lineType);
		circle(	image, Point(501, 255), 5, Scalar(255, 255, 255), thickness, lineType);
		circle(	image, Point( 10, 501), 5, Scalar(255, 255, 255), thickness, lineType);

		imwrite("result.png", image);        // save the image 

		imshow("BP Simple Example", image); // show it to the user
		waitKey(0);

}