K近隣アルゴリズム,Matlab実装
隣接アルゴリズム:K近傍:テストサンプルとトレーニングサンプルの間の距離を計算してから、テストサンプルから一番近いKサンプルを見つけて、彼らの結果を統計して、どのタイプの結果が現れるかの回数が多い場合、テストサンプルの結果を予測します.コードは以下の通りです
第一歩は、各試験サンプルの距離が一番近いK個の結果を統計する.
第二ステップ:統計結果の種類
第三ステップ:各結果を集計し、各テストサンプルの距離が一番近いKサンプルの結果の出現回数を統計する.
第四ステップ:出現回数が一番多い結果を予測結果として求めます.
function label1=KNN(training,testing,k)
[row, column]=size(training);
[row1, column1]=size(testing);
%
distance=[];
for i=1:row1
distance(i,:)=sum((repmat(testing(i,:),row,1)-training(:,1:(column-1))).^2, 2);
end
% K
label=[];% K
for i=1:row1
[a,b]=sort(distance(i,:));% ,b distance
for j=1:k
label(i,j)=training(b(j),column);
end
end
cl=zeros(1,100);
count=1;
cl(1,1)=training(1,column);%
for i=2:row
A=training(i,column);
flag=0;
for j=1:count
if cl(1,j) ==A
flag=1;
break;
end
end
if flag==0
count=count+1;
cl(1,count)=A;
end
end
end_count=zeros(row1,count);%
for i=1:row1
for j=1:k
for l=1:count
if label(i,j)==cl(1,l)
end_count(i,l)=end_count(i,l)+1;
end
end
end
end
cou=0;
label1=[];%
for i=1:row1
k=1;
num=end_count(i,1);
for j=2:count
if num
考え方:第一歩は、各試験サンプルの距離が一番近いK個の結果を統計する.
第二ステップ:統計結果の種類
第三ステップ:各結果を集計し、各テストサンプルの距離が一番近いKサンプルの結果の出現回数を統計する.
第四ステップ:出現回数が一番多い結果を予測結果として求めます.