T-test

1653 ワード

仮定検査
与えられた状況に対して,提出すべき主張が正しいか否かを判断する過程である.
t-testは3つの条件を仮定しなければならない
  • 独立性:2組の接続のペアか
  • 等分散性:両群の分散値が
  • にどの程度近いか
  • 準拠:データが準拠しているかどうか
  • 1. One Sample T-test
    1種類のサンプル値の平均値が特定の値と同じかどうかを比較
  • T-テストプロセス
  • 設定
  • 帰無仮定
    貴務仮説:これは統計学的証拠を通じてこれが正しいか正しくないかを証明しようとする仮説である.
  • 代替シナリオ仮定の設定
    代替案仮定:貴務仮定と対立する命題(通常仮定とは逆)
  • 信頼性の設定(通常95%、99%)
    信頼度95%の意味:母数が信頼区間に含まれる確率は95%であり、仮定誤りがないが偶然成立する確率は5%(白黒論理のように正確ではない)
  • である.
    検査
  • P-value
    p-valueは、与えられた仮定がどれだけ根拠を持っているかを0と1の間の値で表す指標である.P-value低は貴無仮定誤りの確率が高い(誤り)
  • P-value規格
  • P-value<0.01:貴務仮定が正しい確率が0.01以下→誤り(厳格基準)
  • P-value<0.05:貴務仮定が正しい確率が0.05未満→誤り(一般標準)
  • 0.05
  • 0.1
    from scipy import stats
    stats.ttest_1samp(샘플 데이터프레임, 비교하려는 값)
    
    Ttest_1sampResult(statistic=0.5690174909554405, pvalue=0.5694721717152109)
    ex)pvalue 0.56程度の確率で、「サンプルの平均値」は「比較する値」に等しい
    pvalueが(1-confidence)未満の場合、却下は無仮定となり、代替シナリオ仮定が採用されます.
    →貴無仮説誤り、対案仮説正しい感じ
    One-side test VS Two-side test
  • Oneside test:検査
  • 、サンプルデータの平均値がX以上
  • Two-sidetテスト:テスト
  • 、サンプルデータの平均値がXに等しいか等しくないか
    2. Two Sample T-test
    2つのサンプル値の平均値が等しいかどうかを比較
    例文と「貴無仮説:同一/代替案仮説:異なる」、翻訳メモリ
    from scipy import stats
    stats.ttest_ind(샘플1, 샘플2)
    オプション「less」/「great」(片側黒)
    (基本的には両側黒)
    (実行前に更新する必要があります!pip install scipy-upgrade)
    ex) A = [100, 100, 100] B = [0, 0, 0]
    stats.ttest_ind(A, B, alternative = ‘less’).pvalue 1.0
    Aの平均に準じて、Bの平均小確率は1.0である.
    stats.ttest_ind(A, B, alternative = ‘greater’).pvalue 0.0
    Aの平均に準じて、Bの平均のおおよそ率は0.0です