機械学習の辛い鶏はmatlab(二)決定木を使う

625 ワード

けっていじゅ
ID 3決定木を実現し、鳶尾花卉Irisデータセット上で5折交差検証を行った.訓練によって得られた決定ツリーの訓練セットとテストセットでの精度を観測し,その決定ツリーにフィッティングがあったか否かを判断した.これに基づいて、予備剪断および後剪断を実現し、予備剪断ツリーと後剪断ツリーの訓練セットおよびテストセットでの精度を比較した.
(やったばかりで、iris.dataデータセットをアップロードできないので、必要なネットでダウンロードすればいいです~ネット検索であります)
実装プロセス:
まずimportdataを用いる.dataファイルをMatlabのworkspaceにインポートし、regexp関数でAを個別の値に分割してSに保存します.str 2 num関数で文字列を数値に変換してマトリクスaに保存します.便宜上,3種類のアヤメの名前をマトリクスに格納する際に1,2,3に置き換える.情報エントロピーを後で計算するときに使用するために、カスタム関数「count」を使用して、各属性の各クラスの個数を統計します.変数cout 1,count 2,count 3にそれぞれ保存される3つのクラスです.
function [ count ] = classcount( a )
%             ,    
count1=0;
count2