検定手法のまとめ
t検定
1変量のとき
標本平均がある値と有意差があるかどうかを調べる。
2変量のとき
2種類の標本平均に有意差があるかを調べる。ただ、2変量に対応関係があるかどうかで手法が少し異なる。詳細は下のリンクを参照のこと
statsモジュールの関数
分散分析
3つ以上の水準間の平均値に差があるかどうかを検定する。
F比を求めた後に、そこからp値を計算する。
母集団分布が等分散正規分布であると仮定すると、F比の標本分布(F分布)はすでに明らかであるため、F分布の累積分布を用いる事によって、p値を得られる。
F比
F比が大きいと、誤差に比べて効果の影響が大きいと判断される。
F比=\frac{効果の分散の大きさ}{誤差の分散の大きさ}
効果の大きさとはバイオリンプロット同士の距離。群間変動と呼ぶ。
誤差の大きさとはバイオリンプロットの大きさ。郡内変動と呼ぶ。
χ二乗検定
分割表に対するデータの独立性を検定する。
1. 観測度数と期待度数の差を求める。ここで、期待度数はすべて5以上であることが求められる。
以下が期待度数と観測度数の差を表したχ二乗統計量である。
\chi^2=\sum_{i=1}^{m}\sum_{j=1}^{n}\frac{(O_{ij}-E_{ij})^2}{E_{ij}}
上の式はデータ部分のみの分割表がm行n列としている。
Oが観測度数で、Eが期待度数である。
2.p値を求める。
χ二乗統計量の標本分布は、自由度1のχ二乗分布に漸近的に従うと証明されているため、χ二乗分布の累積分布関数 を利用して、p値を求めることができる。
参考ページ
https://qiita.com/kanamae879123/items/ec1226fc6d0ba789ae65
https://qiita.com/kanamae879123/items/2502258737a7d8e181c6
Author And Source
この問題について(検定手法のまとめ), 我々は、より多くの情報をここで見つけました https://qiita.com/kokiMatsuno/items/eee5dc93a5d38a469113著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .