pandasによるDataFrameにおける複数列データの操作

893 ワード

2つの列のデータを同時に処理する例として、2つの列のデータを加算し、別の列を生成します.
import pandas as pd

df = pd.DataFrame({'a': np.random.randn(6),
                   'b': ['foo', 'bar'] * 3,
                   'c': np.random.randn(6)})

print(df)
def add(a, b):
    return a + b


df['Value'] = df.apply(lambda x: add(x['a'], x['c']), axis=1)
print(df)

出力結果:
          a    b         c
0  0.855374  foo  0.596161
1  0.176524  bar -1.598799
2  0.270245  foo -0.600968
3  0.958155  bar -0.097909
4  0.480277  foo -0.340813
5 -0.548556  bar  0.341068

          a    b         c     Value
0  0.855374  foo  0.596161  1.451535
1  0.176524  bar -1.598799 -1.422275
2  0.270245  foo -0.600968 -0.330723
3  0.958155  bar -0.097909  0.860246
4  0.480277  foo -0.340813  0.139464
5 -0.548556  bar  0.341068 -0.207488