ggplot 2(二)

2749 ワード

画像に平滑線を追加
データの分散図のみがある場合は、データの全体的な傾向を見るのは難しいかもしれません.この場合、画像にスムーズラインを追加するのは良い選択です.geomに「smooth」を追加すると、このタスクを簡単に完了できます.geomパラメータにベクトルの列を設定すると、複数のジオメトリ要素を組み合わせることができます.
qplot(carat, price, data = diamonds, geom = c("point", "smooth"))

スムーズなアルゴリズムにも選択肢がたくさんあります.
method="loess":小さなデータセットのデフォルトのスムーズアルゴリズムでは、スムーズ度はspanパラメータで設定されます.span=0の場合は線が曲がり、span=1の場合は最も緩やかです.
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),span = 0.2)
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),span = 1)

アルゴリズムの複雑さのため,大きなデータセットloessにはあまり適用されない.
method=「gam」:データポイントが1000より大きい場合、これはデフォルトのスムーズアルゴリズムです.
library(mgcv)
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),method = "gam", formula = y ~ s(x))

method="lm":線形モデルに使用します.デフォルトは1本の直線で、formula=y~poly(x,2)を二次関数フィッティングに設定したり、splinesパッケージをロードしてformula=y~ns(x,2)を使用したりして、2番目のパラメータは自由度を表し、自由度が高いほどフィッティング曲線が曲がります.
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),method = "lm")
qplot(carat, price, data = dsmall, geom = c("point", "smooth"),method = "lm", formula = y ~ ns(x,5))

箱線図とジグル図を描画します.
1組のデータに分類変数と連続変数がある場合、連続変数の異なる分類での変化に興味を持つ可能性があります.箱線図とジッタ図はこの目的を実現する2つの異なる方法です.
qplot(color, price / carat, data = diamonds, geom = "jitter",alpha = I(1 / 200))
qplot(color, price / carat, data = diamonds, geom = "boxplot")

ヒストグラムと密度図:
ヒストグラムと密度マップは単一変数の分布法則をイメージ的に示すことができるが,異なるクラス間の分布の違いを比較することは困難である.
qplot(carat, data = diamonds, geom = "histogram")
qplot(carat, data = diamonds, geom = "density")

異なる分類間の比較では、次のコードに示すように、外観パラメータオプションを追加できます.
qplot(carat, data = diamonds, geom = "density", colour = color)
qplot(carat, data = diamonds, geom = "histogram", fill = color)

柱状図:
離散変数のヒストグラムである柱状図をgeom=「bar」で設定します.
qplot(color, data = diamonds, geom = "bar")
qplot(color, data = diamonds, geom = "bar", weight = carat) +scale_y_continuous("carat")

時系列分析:
時間データを含むeconomicsデータセットで、失業率が時間とともに変化する画像を作成します.
qplot(date, unemploy / pop, data = economics, geom = "line")

失業率と週失業者数の中位数の関係を観察します.
year 

面分割:
外観パラメータを用いて同じ図で異なる分類の相違を比較する方法について議論した.分割面は、異なるサブクラスを異なる図に配置して比較することができます.
qplot(carat, data = diamonds, facets = color ~ .,geom = "histogram", binwidth = 0.1, xlim = c(0, 3))