Pythonマシン学習01(2)
9070 ワード
01-機械学習に必要な統計学的コア概念の理解
1-1. 機械学習と統計学
1-2. 募集団vs.人数と統計量vs.平均、中間値、最も頻繁な値
1-3. 拡散、標準偏差、範囲、象限ビット数
# numpy는 최빈값과 관련된 함수를 제공하지 않으므로,
# scipy 패키지는 stats 모듈에 있는 mode 함수 사용
import numpy as np
from scipy import stats
np.random.seed(0)
data = np.random.randint(0, 100, 10000)
mean = np.mean(data); print("평균값: ", mean.round(2))
median = np.median(data); print("중앙값: ", median)
mode = stats.mode(data); print("최빈값: {} ({})".format(mode[0][0], mode[1][0]))
# 결과는 다음과 같음
# 평균값: 49.17
# 중앙값: 49.0
# 최빈값: 3 (125)
# 분산과 표준편차, 범위, 사분위수
import numpy as np
from statistics import variance, stdev # 표준편차
np.random.seed(0)
points = np.random.randint(0, 100, 200)
var = variance(points); print("분산: ", var)
std = stdev(points); print("표준편차 : ", np.round(std, 2))
range = np.max(points) - np.min(points); print("범위: ", range)
print("사분위 수: ")
for val in [0, 25, 50, 75, 100]:
quantile = np.percentile(points, val)
print("{}% => {}".format(val, quantile))
q1, q3 = np.percentile(points, [25, 75])
print("IQR: ", q3 - q1)
# 결과는 다음과 같음
# 분산: 821
# 표준편차 : 28.65
# 범위: 99
# 사분위 수:
# 0% => 0.0
# 25% => 24.0
# 50% => 48.0
# 75% => 72.25
# 100% => 99.0
# IQR: 48.25
Reference
この問題について(Pythonマシン学習01(2)), 我々は、より多くの情報をここで見つけました https://velog.io/@dkddkkd55/파이썬머신러닝012テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol