[TIL]カゼ黒


先週、カイ双黒を習いましたが、今日は宿題をしている間にたくさんの場所が詰まっていました.そこでYouTubeを別に見て整理してみました2回目に聞いた内容なので、1回目に聞いた時よりもよく理解できました.

カゼブラック(x)² test)


与えられた変数が独立変数(Quality variableまたはCategorical variable)である場合、Kaj乗検査を使用する.ただし、この場合、データ(資料)の値は全て個数(count)でなければならない.
また、2つのグループがあればBinomic Testを行い、複数のグループがあればKAI乗算検定を行う.

目的


変数が1つある場合は、変数内のグループ間の比率が同じか異なるかを決定し、2つの変数がある場合は、変数間に関連付けがあるかどうかを決定します.

カイに黒を乗じた値は上記のように計算されます.ここで、Oは観察周波数、Eは所望周波数である.
観察頻度はデータ(資料)に自然に与えられた値であり,所望の頻度は他の方法で求めることができる.期待頻度は概念的に期待値に類似した概念であるべきである.

一元カイ次黒² test)


一元ケイ氏乗数検査は変数の場合に行われる.変数はもちろん独立した変数です.変数は2つ以上のカテゴリを有し、符号化時に1つの列に符号化される.
一元カイに黒を乗じた場合、有義性はどの程度異なるかを意味する.ここでは、予め設定された期待頻度とは異なる意味である.
from scipy.stats import chisquare
chisquare(data, axis=None)

# return value: statistic, pvalue
一元カイに黒を乗じて上記のコードで実施することができ、適合度(goodoffit)とも呼ばれる.

にじげんにじほうこくしょく² test)


二元カイ次黒と一元カイ次黒の違いは2つの変数にすぎない!変数は2個なので、もちろんcolumnも2個使います.
二元カイ平方黒の最も簡単な形式は2 x 2形式で、分割テーブル(列連テーブル)を使用します.
パーティションテーブルは、データ周波数が比較的簡単なテーブルで作成されます.2つの変数を行と列の整理頻度のテーブルに分けます.行と列の間、すなわち2つの変数の間に関連があるかどうかを、分割テーブルで確認できます.
彼の例として、脳がんと携帯電話の使用の関連性を確認したい.
貴無仮説:脳がんと携帯電話の使用には関連がない
対立仮説:脳がんと携帯電話の使用に関連がある可能性がある
所望の周波数は、(行合計)x(列合計)/合計として算出することができる.

上記の表から確率を求める場合は、確率を求めるセルと対応するセルの列を分けて確率を求めることができます.

期待周波数は上記のように求められる.まず、所望の周波数が要求されるセルの行の合計と列の合計を乗算します.その後集計を行うと,所望の頻度を求めることができる.
次に、ケイザーに黒を乗じた値を算出し、以下の値を算出する.