[TIL] EDA
💗きょう習ったこと
Excelファイルテーブルで読み込む
xls = pd.ExcelFile('file_name_or_fath')
❗の名前で呼ぶ必要がありますが、書き置きは可能です
xls.sheet_names
はdf1 = pd.read_excel(xls, 'sheet_name1')
df2 = pd.read_excel(xls, 'sheet_name2')
韓国語フォント破裂現象
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
警告メッセージの削除
import warnings
warnings.filterwarnings("ignore")
ビジュアル化
Q-Q plotの作成
✔
import statsmodels.api as sm
例えばSeriesなら?アレイへの変換が重要data= np.array(df['column'])
こうしてArrayに変えてfig = sm.qqplot(data)
plt.show()
📎 How to interpret a QQ plot cross-tabulation
クロス集計表の作成
✔
import seaborn as sns
table = pd.crosstab(df['column1'], df['column2'])
カテゴリボックスの印刷
✔
import seaborn as sns
sns.catplot(data=df, x='종류', y='표시할려는 값', kind = 'box')
ここの種類はユニーク()Reference
この問題について([TIL] EDA), 我々は、より多くの情報をここで見つけました https://velog.io/@kiki_/TILテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol