10.統計関数の適用

1394 ワード

1)平均値

import pandas as pd

df = pd.read_csv('./auto-mpg.csv', header = None)

df.columns = ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model year', 'origin', 'name']

print(df.mean()) # 데이터프레임 내 열별로 평균값 반환
print(df['mpg'].mean()) # 데이터프레임 내 mpg 열의 평균값 반환
print(df[['mpg', 'weight']].mean()) # 데이터프레임 내 mpg열, weight열의 평균값 반환

2)中間値

print(df.median()) # 데이터프레임 내 열별로 중간값 반환
print(df['mpg'].median()) # 데이터프레임 내 mpg 열의 중간값 반환

3)最大値

print(df.max()) # 데이터프레임 내 열별로 최대값 반환
print(df['mpg'].max()) # 데이터프레임 내 mpg 열의 최대값 반환

4)最小値

print(df.min()) # 데이터프레임 내 열별로 최소값 반환
print(df['mpg'].min()) # 데이터프레임 내 mpg 열의 최소값 반환

5)標準偏差

print(df.std()) # 데이터프레임 내 열별로 표준편차값 반환
print(df['mpg'].std()) # 데이터프레임 내 mpg 열의 표준편차 값 반환

6)相関係数

print(df.corr())
# 산술 데이터를 가진 열들로 짝을 지을 수 있는 모든 경우의 수를 찾아서 두 열 사이의 상관계수를 구한다!
print(df[['mpg', 'weight']].corr())
# mpg 열과 weight 열로 짝 지을 수 있는 모든 경우의 수를 찾고 두 열 사이의 상관계수를 구함