マシンラーニングデータプリプロセッシング
データプリプロセッシング
いちじねつコーディング
Thermal Encodingでは、フィーチャー値のタイプに応じて新しいフィーチャーが追加され、ユニークな値に対応するカラムにのみ1が表示され、残りのカラムには0が表示されます.
pandasget dummies()を使用して熱符号化を行う
pd.get_dummies(DataFrame)
フィーチャーのスケーリング
標準化は,データの各特徴を平均値0,分布1のGauss正規分布に変換する値である.
StandardScaler:正規分布に変換し、平均値0、超差1
正規化は,異なる特徴の大きさを統一するために大きさを変換する概念である.
MinMaxScale:データ値を0~1の範囲値に変換します(負の値がある場合は-1から1に変換します).
Reference
この問題について(マシンラーニングデータプリプロセッシング), 我々は、より多くの情報をここで見つけました https://velog.io/@taeho8822/머신러닝-스터디-데이터-전처리Preprocessingテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol