『Learning R』ノートChapter 12 Retrieve data

976 ワード

R自体からのdata
data()は、R本体とpackageにロードされたデータセットを挙げることができる.data(package=.packages(all.available=TRUE))は、すべてのpackageに付属するデータセットをリストすることができます(多くあります).ロードされていないパッケージのデータを読み込む場合は、次のコマンドを使用します.
> data('solder', package = 'rpart')
> View(solder)

TXTタイプのdata
readを使用table()またはread.csv()読み込み.read.csvはreadです.tableのwrapper.ではtableのパラメータheaderのデフォルトはFALSEであり、csvのデフォルトはTRUEである.ではtableのパラメータfillのデフォルトは!blank.lines.skipは、必要に応じて手動でTRUEに変更しなければならない.csvではデフォルトはTRUEです.
read.tableではsepパラメータは、データを区切る文字('''','など)を指定し、nrowは何行を読み込むかを指定し、skipは何行を省略するかを指定します.両者が同時に存在する場合、指定した行数をskipしてから読み込むことは永遠にあります.読み込みファイルの一部をより特定的に指定する場合は、colbycolパッケージまたはsqldfパッケージを使用します.
他のデータソフトウェアファイルから読み込む場合は、na.stringsパラメータ.例えばSQLソースファイルでは、na.strings=‘NULL’. txtタイプのデータを書く場合はwrite.csv()などの関数にパラメータfileEncoding='utf 8を加える
unstructured text filesの場合、readLines()を使用して先に読み込み、ソースファイルを行ごとに分割された長いstringとして保存できます.
xml,html,json略.