R 11日付目


週末は休みだった...KDTを始めてから時間が足りなくて….とにかくスタート!

データプリプロセッシング-必要なフォーマットでデータを加工


dplyrは最もよく使われるパッケージです.
フィルタ()-行を抽出
select()-列の抽出
整列()-整列
mutate()-変数の追加
summarise()-統計の計算
グループby()-グループ化
left join()-データをマージ(列)
bind rows()-データのマージ(行)

条件を満たすデータのみ抽出

  • dplyrパッケージのロード後csv exech.dfでcsvファイル
  • を作成する
    library(dplyr)
    exam <- read.csv("csv_exam.csv")
    exam
  • dplyrパッケージのfilter()を使用して、半分の
  • のみを抽出します.
    exam %>% filter(class == 1)
    %>%記号を使用して、関数をリストするようにコードを記述します.