[基礎統計学]3.確率変数と確率分布

3345 ワード

確率変数と確率分布の概念


ランダム変数


関数
  • は、サンプル空間内の各要素を実数に変換する
  • 確率分布
  • 硬貨を3回投げた実験におけるサンプル空間
    -> S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT}
  • コインの裏面に現れる回数->確率変数
  • ディスクリートサンプル空間


    有限または数え切れない無限の要素からなるサンプル空間.
  • 離散確率変数(離散ランダム変数)
    -コイン正面が現れるまでの実施回数
  • 100製品中の不良品数
  • れんぞくサンプリングくうかん


    実直線上の任意の区間として表すことができるサンプル空間.
  • 連続確率変数(連続ランダム変数)
    -身長と体重
  • 製品ライフサイクル
  • 離散確率分布(離散確率分布)


    離散試料空間の確率変数から生成される確率分布

  • かくりつしつりょうかんすう
    P(X=x) = f(x)
    Σf(x) = 1, 0<=f(x)<=1

  • 例)コイン3回投げたときの裏面の個数Xの確率分布

  • # 표본공간 생성
    > S = tosscoin2(3)
    
    # 뒷면의 개수를 세는 함수 정의
    > countT = function(x) sum(x=="T")
    
    # 확률변수 정의 => apply() 함수를 행별로 적용
    > X = apply(S, 1, countT)
    
    # 원소의 개수 집계 및 확률분포 생성
    > table(X)/nrow(S)
    X
      0     1     2     3
    0.125 0.375 0.375 0.125
  • 例)4回のサイコロ投げ実験で得られた数字とXの確率分布
  • # 주사위 4개의 눈의 합 확률분포
    rolldie.sum(4)
  • 例)50個の製品のうち8個の不良品がある箱から10個の製品をランダムにサンプリングしたところ、発見された不良品数Xの確率分布は
  • であった.
    hyp.sample(50, 8, 10)


    れんぞくかくりつぶんぷ

  • 連続(数えられない)値を有する確率変数の確率分布
  • .
  • 確率分布関数f(x)は確率P(a
  • # 확률밀도함수 f(x) 정의
    > pdf = function(x) 2*exp(-2*x)*(x>0)
    
    # 적분함수 integrate() 사용하여 확률 계산
    > integrate(pdf, 0, 1)[[1]]
    [1] 0.8646647

    せきさんぶんぷかんすう


    確率変数Xがある値xより小さい確率
    F(x) = P(X<=x)
  • 確率分布の累積分布関数(累積分布関数)は、離散型と連続型の区別がなく、以下のように定義される.
    ->累積分布関数F(x)は確率変数値がxより小さい確率の臨端であり、離散確率分布では累積確率分布の等号に注意して確率
  • を計算する必要がある.
  • 例)三次コイン投入率実験における背面個数Xの累積分布関数
  • .
    # 동전 3개 중 뒷면의 개수 
    > (freq = choose(3, 0:3))
    [1] 1 3 3 1
    disc.cdf(0:3, freq, mt = "동전 3개 중 뒷면의 개수 CDF")
  • 例)連続確率分布のCDF(x)=2 e^-2,0を求める.
    # 확률밀도함수 f(x) 정의 및 누적분포함수 그래프 작성
    > pdf = function(x) 2*exp(-2*x)*(x>0)
    
    # 누적 확률 표시 (F(0.2), F(0.4), F(0.6), F(0.8), F(1), F(2))
    cont.cdf(pdf, low=-1, up=3, xs=c((1:5)*0.2, 2))

    連合確率分布(joint prob,dist.function)


    2つ以上の確率変数を処理する必要がある場合、それらの間には相互に影響する可能性があるため、同時に考慮する必要がある.
  • 2個以上の確率変数の確率分布
  • 離散型結合確率分布
    2つの確率変数XとYはxとyの値を同時に持つ確率である.
  • 連続型結合確率分布
    二つの確率変数XとY確率の密度関数を計算する

  • エッジ確率分布


    確率変数xとyの結合確率分布f(x,y)から,各エッジ確率分布