python sklearn one-hot符号化
1050 ワード
from sklearn import preprocessing
enc = preprocessing.OneHotEncoder()
enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//
print(enc.transform([[0,1,3]]).toarray())
print(enc.transform([[0,1,1]]).toarray())
上のコードenc.fit()には4行3列のマトリクスがあります
したがって、第1の特徴のone-hot符号化は、2ビットの01列であり、第2の特徴は、3ビットの01列であり、第3の特徴は、4ビットの01列であるである.