[R]精製異常値


例外値


通常のカテゴリより大きい値

例外値の削除


確認
  • 以上
  • table(데이터프레임$확인할변수명)
  • の結果に変数が持たない値がある場合、
  • となります.
  • 接合測定処理
  • outlier$score <- ifelse(outlier$score == 이상값, NA, outlier$score)
  • 分析時除外測定値
  • outlier %>%
      filter(!is.na(sex) & !is.na(score)) %>%
      group_by(sex) %>%
      summarise(mean_score = mean(score))

    極端値


    論理に存在する可能性がありますが、値は極端に大きいか、非常に小さいです.
  • 論理判断
  • 統計規格
  • を使用
  • 箱図(Boxplot)
  • ブロック図で極端値を指定する

  • 枠の画像
  • を作成
    boxplot(mpg$hwy)
  • 箱基準上下直線が極端値境界からずれる、直線が極端値
  • からずれる.
  • 枠の画像を生成するための統計出力
  • .
    boxplot(mpg$hwy)$stats
    -- 결과
         [,1]
    [1,]   12 # 아래쪽 극단치 경계
    [2,]   18 # 1사분위 수
    [3,]   24 # 중앙값
    [4,]   27 # 3사분위 수
    [5,]   37 # 위쪽 극단치 경계
    attr(,"class")
            1 
    "integer" 
  • 接合測定処理
  • mpg$hwy <- ifelse(mpg$hwy < 12 | mpg$hwy > 37, NA, mpg$hwy)
    table(is.na(mpg$hwy))
    -- 결과
    FALSE  TRUE 
      231     3 
  • 測定値を除外する解析
  • を実行する.
    mpg %>%
      group_by(drv) %>%
      summarise(mean_hwy = mean(hwy, na.rm = T))