2つの母集団から抽出した標本から,母平均の差の検定をする方法


1.この記事でまとめたいこと

2つの母集団から無作為に標本を抽出し,その標本から母平均に差があるかの検定を行う方法。
絵でいうと下記。

2.まとめた背景

参考書などで勉強していたところ,母分散の前提として下記3つのケースの検定が出てきた。

  • 母分散既知
  • 母分散未知 ただし,${\sigma_X }^2 ={\sigma_Y }^2$
  • 母分散未知 ・・・Welchのt検定

それぞれのケースで,新たに定義する確率変数や,その確率変数が従う分布(標準正規分布/t分布)が異なっており,覚えられなかった。
基本となる出発点と,3つのケースの対比という見方をすれば,理解できそうなのでまとめた。

3.基本となる出発点

母平均の差の検定をするには,標本平均の差($\bar{X} -\bar{Y}$)から求められそうなことはわかる。
そこで,確率変数$\bar{X} -\bar{Y}$の分布を考えると,下記となる。

  • 分布:正規分布・・・X,Yそれぞれ正規分布なので
  • 平均:$\mu_X -\mu_Y$・・・確率変数から自明
  • 分散:$\frac{{\sigma_X }^2 }{m}+\frac{{\sigma_Y }^2 }{n}$・・・XとYは独立のため,分散はそれぞれの和になる

つまり,下記確率変数Tを定義して,確率変数$\bar{X} -\bar{Y}$を標準化すると,Tは標準正規分布N(0,1)に従う。

T=\frac{\left(\bar{X} -\bar{Y} \right)-\left(\mu_X -\mu_Y \right)}{\sqrt{\frac{{\sigma_X }^2 }{m}+\frac{{\sigma_Y }^2 }{n}}}

なお,ココの導出はモーメント母関数を使用することでも可能。マセマ出版社の参考書 P.201参照
この確率変数Tを念頭に置くと,3つのケースがすっと頭に入ると思う。

4.3つのケースで考えると

それぞれのケースの対比を取って考えると,下図のようにまとめることができる。

ポイントとしてはこのあたりだと思う。

  • ①~⑤の流れは全て共通
  • ②で帰無仮説($\mu_X =\mu_Y$)を前提とするため,確率変数から$\mu_X -\mu_Y$は消える
  • 母分散未知のケースは母分散を不偏分散的なもので代用するため,確率変数はt分布に従う※

※の部分は,別記事の★2参照

5.参考文献

・マセマ出版社 統計学キャンパス・ゼミ 改訂5 P.200-211
https://www.mathema.jp/product/統計学キャンパス・ゼミ-改訂5/

・ヨビノリ 確率統計 推定・検定入門
https://www.youtube.com/playlist?list=PLDJfzGjtVLHmx7qMP410-9gx0weC9d90X