R 6日目

3035 ワード

外部データの使用

  • でダウンロードしたデータファイルをプロジェクトフォルダに入れます.
  • readxlパッケージをインストールし、
  • をロードします.
    install.packages("readxl")
    library(readxl)
  • Excelファイル
  • を読み込みます.
    df_exam <- read_excel("excel_exam.xlsx")	#엑셀 파일을 불러와 df_exam에 할당
    df_exam
    
    ##	id  class  math  english  science
    
    ##	1   1	   50	 98		  50
    ##	2   1	   60	 97		  60
    ##	3   1	   45	 86		  78
    ##	4   1	   30	 98		  58
    ##	5   2	   25	 80		  65
    ....
    分析

  • 英語と科学の平均点
  • mean(df_exam$english)
    
    ## [1] 84.9
    
    mean(df_exam$science)
    
    ##[1] 59.45

    Excelファイルの最初の行が変数名でない場合は?


    元のExcelファイルは1行目に変数名を入力しています.read excel()デフォルトでは、Excelファイルの最初の行が変数名として認識されます.
    最初のローが変数名でない場合、最初のローのデータは失われます.

    1行目のデータとして認識


    col names=F=>変数名をx数値として自動的に決定します.

    Excelファイルには複数のページがありますか?


    sheetパラメータを使用して、何枚目の図面からデータをロードするかを決定できます.
    df_exam_sheet <- read_excel("excel_exam_sheet.xlsx", sheet = 3)

    CSVファイルの読み込み

  • プロジェクトフォルダ
  • にCSVファイルを挿入する
  • read.csv()
  • df_csv_exam <- read.csv("csv_exam.csv")
    df_csv_exam
    
    ##   id class math english science
    ##1   1     1   50      98      50
    ##2   2     1   60      97      60
    ##3   3     1   45      86      78
    ##4   4     1   30      98      58
    ##5   5     2   25      80      65
    ...

    文字を含むファイルを読み込む場合、stringAssoctors=F

    df_csv_exam <- read.csv("csv_exam.csv", stringAsFactors = F

    データフレームをCSVファイルとして保存

  • データフレーム
  • を作成する
    df_midterm <- data.frame(english = c(90, 80, 60, 70),
    			 math = c(50, 60, 100, 20),
                 		 class = c(1, 1, 2, 2))
                         
    df_midterm
    
    ##   english  math  class
    ## 1      90   50     1
    ## 2      80   60     1
    ## 3      60  100     2
    ## 4      70   20     2
  • CSVファイルとして保存
    write.csv()を使用して格納します.
  • write.csv(df_midterm, file = "df_midterm.csv")

    RDataファイルの利用


    RDataはR専用データファイルです.
    他のファイルに比べて、読み書き速度が速く、容量が小さいなどの利点があります.
    1.データフレームをRDataファイルとして保存する
    save(df_midterm, file = "df_midterm.rda")
  • RDataファイル
  • にロード
    rm(df_midterm)	#데이터 프레임 삭제
    
    df_midterm
    ## error
    load("df_midterm.rda")
    
    df_midterm
    
    ##   english  math  class
    ## 1      90   50     1
    ## 2      80   60     1
    ## 3      60  100     2
    ## 4      70   20     2
    RDataはインポート後すぐに使用できますが、csv、excelはインポート後に変数に割り当てる必要があります.
    df_exam <- read_excel("excel_exam.xlsx")
    
    df_csv_exam <- read.csv("csv_exam.csv")
    
    load("df_midterm.rda")