R 7日目

1560 ワード

データの理解


関数のタイプ


head():データフロントエンド出力
tail():データ末尾出力
view():ビューアウィンドウでデータをチェックする
dim():データ次元出力
str():出力データ属性
サマリー():サマリー統計出力
ファイルの読み込みとデータフレームの作成
exam <- read.csv("csv_exam.csv")
  • head()-データフロントエンド
  • を確認します.
    head(exam) # 앞에서부터 6행까지 출력
    
    head(exam, 10) # 앞에서부터 10행까지 출력
  • tail()-データの後ろにある
  • を確認します.
    tail(exam) # 뒤에서부터 6행까지 출력
    
    tail(exam, 10) # 뒤에서부터 10행까지 출력
  • ビュー()-ビューアウィンドウでデータを表示する
  • View(exam)
  • dim()-データが数行、数列で構成されていることを理解する
  • dim(exam)
    ##[1] 20 5
  • str()-属性
  • について
    str(exam)  # 데이터 속성 확인하기
  • 要約(試験)-要約統計出力
    出力結果から,データを構成する変数の要約統計が分かる.
    最小-最大値
    1 st Qua-1象限位数(サブ25%)
    Median-中心値(中央)
    Mean-平均
    3 rd Qua-3象限位数(サブ75%)
    Max-最大値
  • summary(exam)

    mpgデータの表示

  • ggplot 2パッケージ
  • をインストール
    install.packages("ggplot2")
  • gplot 2パッケージからmpgデータを読み込み、データフレーム
  • を作成する.
    mpg <- as.data.frame(ggplot2::mpg)
  • head()、tail()、View()を使用してデータ
  • を分析
    head(mpg)
    
    tail(mpg)
    
    View(mpg)
  • dim()を使用して、データが何行、何列からなるかを決定する
  • .
    dim(mpg)
    ## [1] 234 11