DataFrame-str.slice


str.sliceを使用してDataFrame値をクリップ

  • のデータ列値を受信すると、str形式の次の数値列値が表示される場合があります.
  • data.head(10)

  • この場合、columnの「出席率」の分子値と分母値を取得し、数値型に変換し、値を分離します.

  • このときstr.sliceを用いて分母と分子値を取得する.
  • data['분자'] = data['출석율'].str.slice(start=0, stop=2)
    ## 앞에 두 글자를 가져온다.
    data['분모'] = data['출석율'].str.slice(start=-2)
    ## 뒤에서 부터 두 글자를 가져온다.
    
    data.head()
  • の場合、分母と分子値は「object」としてロードされます.
  • data.info()
    <class 'pandas.core.frame.DataFrame'>
    Int64Index: 184 entries, 0 to 183
    Data columns (total 8 columns):
     #   Column  Non-Null Count  Dtype  
    ---  ------  --------------  -----  
     0   전직분     184 non-null    object 
     1   이름      184 non-null    object 
     2   또래      184 non-null    float64
     3   출석율     175 non-null    object 
     4   성별      184 non-null    object 
     5   서베이응답자  184 non-null    object 
     6   분자      175 non-null    object 
     7   분모      175 non-null    object 
    dtypes: float64(1), object(7)
    memory usage: 12.9+ KB
  • は現在、to numericalを使用してデジタルに変換されています.
  • data['분모'] = pd.to_numeric(data['분모'])
    data['분자'] = pd.to_numeric(data['분자'])
    
    data.info()
    <class 'pandas.core.frame.DataFrame'>
    Int64Index: 184 entries, 0 to 183
    Data columns (total 8 columns):
     #   Column  Non-Null Count  Dtype  
    ---  ------  --------------  -----  
     0   전직분     184 non-null    object 
     1   이름      184 non-null    object 
     2   또래      184 non-null    float64
     3   출석율     175 non-null    object 
     4   성별      184 non-null    object 
     5   서베이응답자  184 non-null    object 
     6   분자      175 non-null    float64
     7   분모      175 non-null    float64
    dtypes: float64(3), object(5)
    memory usage: 12.9+ KB
  • 最後に出席率を求めた.
  • data['출석'] = data['분자']/data['분모']*100
    data.head()