pandas常用関数ノート

1307 ワード

1.   .groupby()


データセットを自然な方法でスライス、スライス、要約などの操作を行う.1つ以上のキー(関数、配列、またはDataFrame列名)に基づいてpandasオブジェクトを分割します.
>>>import pandas as pd
>>>df=pd.DataFrame({'key1':['a','a','b','b','a'],
    'key2':['one','two','one','two','one'],
    'data1':np.random.randn(5),
    'data2':np.random.randn(5)})
>>>df
            data1    data2    key1    key2
0        -0.410673  0.519378   a      one
1        -2.120793  0.199074   a      two
2        0.642216   -0.143671  b      one
3        0.975133   -0.592994  b      two
4        -1.017495  -0.530459  a      one

# key1 , data1 
>>>grouped=df['data1'].groupby(df['key1'])
>>>grouped.mean()
key1
a    -1.182987
b    0.808674

>>>means=df['data1'].groupby(df['key1'],df['key2']).means()
key1  key2
a     one    -0.714084
      two    -2.120793
b     one     0.642216
      two     0.975133

2. .groupby().apply()


まずグループ化し、各グループにapply関数の操作を適用します.

3. .loc()と.iloc()


loc-行ラベルによる行データiloc-行番号による行データのインデックス
具体的には以下のブログを参考に
https://blog.csdn.net/hecongqing/article/details/61927615
未完待機