tidyverse入門編 〜インストールと特徴〜


6年くらい前にRやってて、仕事で必要になったので再勉強
どうやらtidyverseというパッケージで学ぶとモダンなデータ分析ができるらしい

パッケージインストール

Rstudioを使っていきます。

install.packages("tidyverse")

続けて読み込み

library(tidyverse)

すると

─ Attaching packages ─────────────────────────────────────────────────────────────── tidyverse 1.3.0 ─
✓ tibble  2.1.3     ✓ dplyr   0.8.4
✓ tidyr   1.0.2     ✓ stringr 1.4.0
✓ readr   1.3.1     ✓ forcats 0.4.0
✓ purrr   0.3.3     
─ Conflicts ───────────────────────────────────────────────────────────────── tidyverse_conflicts() ─
x dplyr::filter() masks plotly::filter(), stats::filter()
x dplyr::lag()    masks stats::lag()

あー、なんかみたことあるパッケージ名がある
便利なパッケージ群ってことなんだねtidyverse

このテキストを使って勉強していきます

インストールされたパッケージの中身を確認

ggplot2
データを可視化するためのパッケージ
dplyr
データに様々な操作を加えるためのパッケージ
tidyr
データをtidy dataの型式に変形するためのパッケージ
readr
様々なフォーマットのデータを読み書きするためのパッケージ
purrr
関数型プログラミングのためのパッケージ
tibble
tibbleというモダンなdata.frameを提供するパッケージ
stringr
文字列を操作するためのパッケージ
forcats
因子型ベクトルを操作するためのパッケージ

おお、これはすごい。
データ可視化して分析するためのツールは1通りありそうですね。
目的によっては足りないですが、初心者もどきがやり直すには良さそうです。
所々固有名詞みたいなワードがあるので、この辺りがtidyverseの特徴なのでしょうj。

次は、データの前処理やっていきます。