R 6日目
外部データの使用
install.packages("readxl")
library(readxl)
df_exam <- read_excel("excel_exam.xlsx") #엑셀 파일을 불러와 df_exam에 할당
df_exam
## id class math english science
## 1 1 50 98 50
## 2 1 60 97 60
## 3 1 45 86 78
## 4 1 30 98 58
## 5 2 25 80 65
....
分析英語と科学の平均点
mean(df_exam$english)
## [1] 84.9
mean(df_exam$science)
##[1] 59.45
Excelファイルの最初の行が変数名でない場合は?
元のExcelファイルは1行目に変数名を入力しています.read excel()デフォルトでは、Excelファイルの最初の行が変数名として認識されます.
最初のローが変数名でない場合、最初のローのデータは失われます.
1行目のデータとして認識
col names=F=>変数名をx数値として自動的に決定します.
Excelファイルには複数のページがありますか?
sheetパラメータを使用して、何枚目の図面からデータをロードするかを決定できます.
df_exam_sheet <- read_excel("excel_exam_sheet.xlsx", sheet = 3)
CSVファイルの読み込み
df_csv_exam <- read.csv("csv_exam.csv")
df_csv_exam
## id class math english science
##1 1 1 50 98 50
##2 2 1 60 97 60
##3 3 1 45 86 78
##4 4 1 30 98 58
##5 5 2 25 80 65
...
文字を含むファイルを読み込む場合、stringAssoctors=F
df_csv_exam <- read.csv("csv_exam.csv", stringAsFactors = F
データフレームをCSVファイルとして保存
df_midterm <- data.frame(english = c(90, 80, 60, 70),
math = c(50, 60, 100, 20),
class = c(1, 1, 2, 2))
df_midterm
## english math class
## 1 90 50 1
## 2 80 60 1
## 3 60 100 2
## 4 70 20 2
write.csv()を使用して格納します.
write.csv(df_midterm, file = "df_midterm.csv")
RDataファイルの利用
RDataはR専用データファイルです.
他のファイルに比べて、読み書き速度が速く、容量が小さいなどの利点があります.
1.データフレームをRDataファイルとして保存する
save(df_midterm, file = "df_midterm.rda")
rm(df_midterm) #데이터 프레임 삭제
df_midterm
## error
load("df_midterm.rda")
df_midterm
## english math class
## 1 90 50 1
## 2 80 60 1
## 3 60 100 2
## 4 70 20 2
RDataはインポート後すぐに使用できますが、csv、excelはインポート後に変数に割り当てる必要があります.df_exam <- read_excel("excel_exam.xlsx")
df_csv_exam <- read.csv("csv_exam.csv")
load("df_midterm.rda")
Reference
この問題について(R 6日目), 我々は、より多くの情報をここで見つけました https://velog.io/@y7y1h13/R-6일차テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol