pandasノート(6)DataFrame数学演算

12852 ワード

えんざんえんざん
  • 任意の1列の加算、減算、乗算、1つの値
  • を除く.
    DataFrameの作成
    import  numpy as np
    import pandas as pd
    df = pd.DataFrame(np.arange(16).reshape((4,4)),index = list('abcd'),columns=['A','B','C','D'])
    
    #    
    	A	B	C	D
    a	0	1	2	3
    b	4	5	6	7
    c	8	9	10	11
    d	12	13	14	15
    

    加算:
    # A       5 
    df['A'] = df['A'] + 5
    df
    
    #   
    	A	B	C	D
    a	5	1	2	3
    b	9	5	6	7
    c	13	9	10	11
    d	17	13	14	15
    

    減算:
    # A       5 
    df['A'] = df['A'] - 5
    df
    
    #   
    	A	B	C	D
    a	-5	1	2	3
    b	-1	5	6	7
    c	3	9	10	11
    d	7	13	14	15
    

    乗算:
    # A       5 
    df['A'] = df['A'] * 5
    df
    
    #   
    
    	A	B	C	D
    a	0	1	2	3
    b	20	5	6	7
    c	40	9	10	11
    d	60	13	14	15
    

    除算演算:
    # A       5 
    df['A'] = df['A'] / 5
    df
    
    #   
    	A	B	C	D
    a	0.0	1	2	3
    b	0.8	5	6	7
    c	1.6	9	10	11
    d	2.4	13	14	15
    
  • 任意の1列の加算、減算、乗算、1つの列を除く
  • .
    2 DataFrame加算、減算、乗算、除算
    2つのDataFrameは4つの演算を行い、同じ行、列インデックス名を持つ必要があります.インデックス名が異なる場合は、NANを返します.
    '''      4*4 3*3 df df1。  df1   D ,d ,  df+df1 ,     NAN'''
    df = pd.DataFrame(np.arange(16).reshape((4,4)),index = list('abcd'),columns=['A','B','C','D'])
    df1= pd.DataFrame(np.arange(9).reshape((3,3)),index = list('abc'),columns=['A','B','C'])
    df+df1
    
    #   
    	A		B		C		D
    a	0.0		2.0		4.0		NaN
    b	7.0		9.0		11.0	NaN
    c	14.0	16.0	18.0	NaN
    d	NaN		NaN		NaN		NaN
    

    add()関数を使用する場合はfill_を使用できます.valueメソッドは、単一のdfの欠落したデータを埋め込むが、両方のdfがNANのデータである場合、このメソッドは埋め込まれない.
    '''  add  ,        0'''
    df.add(df1,fill_value=0)
    
    #   
    
    	A		B		C		D
    a	0.0		2.0		4.0		3.0
    b	7.0		9.0		11.0	7.0
    c	14.0	16.0	18.0	11.0
    d	12.0	13.0	14.0	15.0
    
  • 演算子とpandas操作関数
  • 演算子
    アクション関数
    コメント
    +
    add()
    加算
    -
    sub()
    減算
    *
    mul()
    乗算#ジョウサン#
    /
    div()
    除算
    //
    floordiv()
    とりあつかい
    **
    pow()
    乗方
    %
    mod()
    余剰を取る
    集約関数
    pandasでよく使用される集約関数は、max()、min()、mean()、sum()、count()、value_counts()、など
    sun()とcount()を例に挙げると、
    ''' df     '''
    df.sum(axis=1)
    
    #   
    a     6
    b    22
    c    38
    d    54
    dtype: int64
    
    
    ''' df     '''
    df.count(axis=0)
    
    #   
    A    4
    B    4
    C    4
    D    4
    dtype: int64