サンプル分布


統計的推定
サンプリング調査で募集団を解釈する
多くの場合、全面的な調査は不可能です
サンプリング調査は必然的に誤差を生じる
適切なサンプリング方法が必要
標本と募集団の関係を理解する
-単純ランダム抽出
-小切手の使用
-乱数番号ジェネレータの使用
サンプリングぶんぷ
-統計量の確率分布
サンプル平均
統計
しりょうへいきんぶんぷ
x1,x2,…,xnx_1, x_2,\dots, x_nx1​,x2​,…,xn​
平均:μ\muμ, 一時的認可:σ2\sigma^2σ2
Xˉ\bar{X}Xˉ~N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})N(μ,nσ2​)
import numpy as np
xbars = [np.mean(np.random.normal(size = 10)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))

xbars = [np.mean(np.random.normal(loc=10, scale=3, size=10)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
import matplotlib as plt
h = plt.pyplot.hist(xbars, range=(0,10), bins=30)
ちゅうしんきょくげんていり
募集団から抽出した標本の測定値
nは十分大きい(n≧30)(ngeq 30)(n≧30);
近似Xˉ\bar{X}Xˉ~N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})N(μ,nσ2​)
import numpy as np
import matplotlib as plt
n = 3
xbars = [np.mean(np.random.rand(n) * 10) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range=(0,10), bins=100)

import numpy as np
import matplotlib as plt
n = 2
xbars = [np.mean(np.random.exponential(scale=3, size = n)) for i in range(10000)]
print('mean %f, var %f' %(np.mean(xbars), np.var(xbars)))
h = plt.pyplot.hist(xbars, range=(0,10), bins=100)