統計に関する数値指標について100%自分用のメモ


相関

2つの事象の間にある何らかの関係のこと。
-1~1の相関係数で表す。因果関係とは異なる点に注意。

有意水準

こっちにちゃんと書いた

度数分布

一定区間に区切った階級に含まれるデータの総数の分布。
ヒストグラムなどを使って表現する。

分散

データの平均値との差の二乗を平均したもの

標準偏差

分散の平方根

中央値

大小に並べたとき、中央の値。
9個なら5番目、8個なら4番目と5番目の平均。

モード

一番多く出現している値。

ポアソン分布

単位時間あたりにある事象が平均してλ回起こる場合に、その事象がx回起こる確率。むず。
$$f(x) = \frac{e^{-\lambda}\lambda^x}{x!}$$

正規分布

山の形をした一般的な分布。標準偏差と平均を決めてあげたら定まるよ。

累積度数分布

度数の合計を積み上げて、分布の偏りを示す。
ローレンツ曲線によって視覚化し、ジニ係数で偏り具合を数値化する。

移動平均

一定期間の平均の変化を時系列で追うことによって、季節などの変動を除いた増減が分かりやすくなる。
各月とその前後の月の平均値を使う中央移動平均、各月とそれ以前の月の平均値を使う後方移動平均、各月とそれ以後の月の平均値を使う前方移動平均がある。