[R]精製異常値
例外値
通常のカテゴリより大きい値
例外値の削除
確認
table(데이터프레임$확인할변수명)
outlier$score <- ifelse(outlier$score == 이상값, NA, outlier$score)
outlier %>%
filter(!is.na(sex) & !is.na(score)) %>%
group_by(sex) %>%
summarise(mean_score = mean(score))
極端値
論理に存在する可能性がありますが、値は極端に大きいか、非常に小さいです.
ブロック図で極端値を指定する
boxplot(mpg$hwy)
boxplot(mpg$hwy)$stats
-- 결과
[,1]
[1,] 12 # 아래쪽 극단치 경계
[2,] 18 # 1사분위 수
[3,] 24 # 중앙값
[4,] 27 # 3사분위 수
[5,] 37 # 위쪽 극단치 경계
attr(,"class")
1
"integer"
mpg$hwy <- ifelse(mpg$hwy < 12 | mpg$hwy > 37, NA, mpg$hwy)
table(is.na(mpg$hwy))
-- 결과
FALSE TRUE
231 3
mpg %>%
group_by(drv) %>%
summarise(mean_hwy = mean(hwy, na.rm = T))
Reference
この問題について([R]精製異常値), 我々は、より多くの情報をここで見つけました https://velog.io/@atmolysis/R-이상치-정제하기テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol