検定手法のまとめ


t検定

1変量のとき

標本平均がある値と有意差があるかどうかを調べる。

2変量のとき

2種類の標本平均に有意差があるかを調べる。ただ、2変量に対応関係があるかどうかで手法が少し異なる。詳細は下のリンクを参照のこと
statsモジュールの関数

分散分析

3つ以上の水準間の平均値に差があるかどうかを検定する。
F比を求めた後に、そこからp値を計算する。
母集団分布が等分散正規分布であると仮定すると、F比の標本分布(F分布)はすでに明らかであるため、F分布の累積分布を用いる事によって、p値を得られる。

F比

F比が大きいと、誤差に比べて効果の影響が大きいと判断される。

F比=\frac{効果の分散の大きさ}{誤差の分散の大きさ}

効果の大きさとはバイオリンプロット同士の距離。群間変動と呼ぶ。
誤差の大きさとはバイオリンプロットの大きさ。郡内変動と呼ぶ。

χ二乗検定

分割表に対するデータの独立性を検定する。

1. 観測度数と期待度数の差を求める。ここで、期待度数はすべて5以上であることが求められる。
以下が期待度数と観測度数の差を表したχ二乗統計量である。

\chi^2=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}

上の式はデータ部分のみの分割表がm行n列としている。
Oが観測度数で、Eが期待度数である。

2.p値を求める。

χ二乗統計量の標本分布は、自由度1のχ二乗分布に漸近的に従うと証明されているため、χ二乗分布の累積分布関数 を利用して、p値を求めることができる。

参考ページ

https://qiita.com/kanamae879123/items/ec1226fc6d0ba789ae65
https://qiita.com/kanamae879123/items/2502258737a7d8e181c6