仮定性能を検証するためにNull値を生成
871 ワード
仮定性能を検証するためにNull値を生成
Training setに空の値がなく、test setに空の値しか存在しない場合は、test setにどの埋め込みが良いか分かりません.
この場合、null値はトレーニングセットで生成され、パフォーマンス比較が行われ、テストセットが充填されます.
Ex:Testing set column 3には15%のNull値が存在します.
train test splitを使用して空の値を作成する
Import Libraryの後で行い、性能比較はK倍で行うことができる.
Training setに空の値がなく、test setに空の値しか存在しない場合は、test setにどの埋め込みが良いか分かりません.
この場合、null値はトレーニングセットで生成され、パフォーマンス比較が行われ、テストセットが充填されます.
Ex:Testing set column 3には15%のNull値が存在します.
Import Library
# import library
from sklearn.model_selection import train_test_split
Split to nonNull and null X and yX_nonNull, X_null, y_nonNull, y_null = train_test_split(X, y, test_size=0.15, random_state=42)
Generate Null ValueX_null['column_3'] = np.nan
Concat nonNull and null Data Sets# concat
X = pd.concat([X_nonNull, X_null])
# reordered by index
X = X.sort_index(ascending=True)
充填はReference
この問題について(仮定性能を検証するためにNull値を生成), 我々は、より多くの情報をここで見つけました https://velog.io/@dohy426/Imputation-성능-확인을-위한-Null-값-생성テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol