pandas常用関数ノート
1307 ワード
1. .groupby()
データセットを自然な方法でスライス、スライス、要約などの操作を行う.1つ以上のキー(関数、配列、またはDataFrame列名)に基づいてpandasオブジェクトを分割します.
>>>import pandas as pd
>>>df=pd.DataFrame({'key1':['a','a','b','b','a'],
'key2':['one','two','one','two','one'],
'data1':np.random.randn(5),
'data2':np.random.randn(5)})
>>>df
data1 data2 key1 key2
0 -0.410673 0.519378 a one
1 -2.120793 0.199074 a two
2 0.642216 -0.143671 b one
3 0.975133 -0.592994 b two
4 -1.017495 -0.530459 a one
# key1 , data1
>>>grouped=df['data1'].groupby(df['key1'])
>>>grouped.mean()
key1
a -1.182987
b 0.808674
>>>means=df['data1'].groupby(df['key1'],df['key2']).means()
key1 key2
a one -0.714084
two -2.120793
b one 0.642216
two 0.975133
2. .groupby().apply()
まずグループ化し、各グループにapply関数の操作を適用します.
3. .loc()と.iloc()
loc-行ラベルによる行データiloc-行番号による行データのインデックス
具体的には以下のブログを参考に
https://blog.csdn.net/hecongqing/article/details/61927615
未完待機