LabelEncoder文字データを数値に変換

1036 ワード

テキストリンク

データを見ると、次のような文字セルが表示されます.

これらのデータは、コンピュータが認識できないため、数字に変える必要があります.
その前に、どのユニットが文字で書かれているかを見てみましょう.

cat_cols = all_data2.columns[all_data2.dtypes == object]
cat_cols

どのカラムのデータがdtypes == object文字であるかを確認できます.
次のような例があります.

上記のユニットのデータが文字であることを確認できます.今文字を数字に変えましょう
ちなみに、ここで述べた文字を数字に変換するという意味は
すなわち、Animal TypeがCatであれば、0,Dog,1となり、このように符号化される.

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
for i in cat_cols:
    all_data2[i] = le.fit_transform(list(all_data2[i]))
all_data2

すべての文字ユニットに対してfit_transformをすればいいです.
そのパラメータで対応するセルを入れ、ここでlistに変換した理由は何でしょうか.
空の値を処理するためです.
処理というよりlistに変換すると、Nullが再認識され、nullの値はすべて同じ数字に変換されて処理される.
データにnullの値がない場合は、listを省略することができる.

Reference

この問題について(LabelEncoder文字データを数値に変換), 我々は、より多くの情報をここで見つけました https://velog.io/@yelim421/LabelEncoder-문자-데이터를-숫자로-변환

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

Chapter 1-5 Searching an Ordered Array

数分でフォームを作成します.