pandas メモ


サンプルデータ

import pandas as pd
from sklearn.datasets import load_iris

# データ取得(アイリスという花のデータセット)
iris = load_iris()
data = iris.data
columns = iris.feature_names

# pd.DataFrame
df = pd.DataFrame(data=data, columns=columns)

データ全体を確認

先頭からデータを表示: head()

df.head() # 引数なしで5件表示

df.head(10) # 引数分データを表示

末尾のデータを表示: tail()

df.tail() # 引数なしで5件表示

df.head(10) # 引数分データを表示

列(column)、行(index)の確認: columns, index

df.columns # 列

df.index # 行

各カラムの最大値、最小値: max(), min()

# 最大値
df.max()
# 最小値
df.min()

各カラムの平均、標準偏差: mean(), std()

df.mean() # 平均

df.std() # 標準偏差

最大、最小値や平均値をまとめて確認: describe()

df.describe()

データの中身を確認

データ型を確認: dtypes

df.dtypes

欠損値(NaN)の確認: isnull()

df.isnull() # NaNがTrueで表示される

df.isnull().sum() # NaNの合計