統計検定3級(新出題範囲) 2021年6月過去問


統計検定3級(新出題範囲) 2021年6月過去問の解答についての補足です。
まだ、公式の解説がでていないので、自己採点の範囲内ですが確認したところを解説します。
問題文の転載は行いませんので、下記のPDFを読みながら確認してください。
(ご指摘などあればコメントいただければ )

問題 / 解答

問1

こちらは、質的変数と量的変数に関する問題です。
料金とポイント残高が量的変数になります。
日付については量的変数の間隔尺度になり得る場合もあります。
https://bellcurve.jp/statistics/course/1562.html

問2

a. 割合の比較には帯グラフや積み上げ棒グラフを利用します。
https://bellcurve.jp/statistics/course/18865.html
b. 推移には、折れ線グラフを利用します。
https://bellcurve.jp/statistics/course/18948.html
c. 複数の事象のばらつきを比較するには箱ひげ図を利用します。
https://bellcurve.jp/statistics/course/19279.html

問3

[1]

幹葉図の問題です。最も多く現れる数を見つけます。
https://bellcurve.jp/statistics/course/5228.html
https://bellcurve.jp/statistics/course/19014.html

[2]

中央値は偶数個数なので、小さい方から数えて10番目と11番目の54と55の間の54.5になります。
https://bellcurve.jp/statistics/course/19014.html

問4

まずは建物火災の発生件数(件)を小さい順番に並べます。

第1四分位は、初めから数えて25%の位置にある数、第3四分位は75%の位置にある数です。

I. 四分位範囲を計算すると、第3四分位(=5) - 第1四分位(=2) = 3なので6より小さい
II. 平均は2.5なので等しくはない
III. 最頻値は1である

問5

勝ち数が左から順番に小さい順に並んでいる事に注目してください。

[1]

I. 中央値は、人数の半分である19.5を含む勝ち数が7のときです。
II. 勝ち数の最小は1です。
III. 勝ち数の最頻値は人数が9人である7の場合です。

[2]

勝ち数の平均値は勝ち数と人数をかけたものを人数(38)で割ったものです。
7.68となり、約7.7になります。

問6

[1]

I. 2012の四分位範囲は350-300で約50千円、2017の四分位範囲は400-350で約50千円となります。
II. 2017の中央値は370で2012の中央値は320なので、約1.16倍。
III. グラフをみたところ、2017の中央値は2012の第3四分位数よりも大きい。

[2]

a. ヒストグラムの横軸の最小値に注目すると2012のものである
b. あてはまらない
c. ヒストグラムの横軸の最大値に注目すると2017年のものである

問7

[1]

I. グラフから読み取ることができる。
II. グラフから読み取ることができる。
III. グラフの2015年で一度下がっている。

[2]

グラフから2016の99.9から2016の99.2をひいて0.7になる

[3]

2014の伸び率に注目すると①が妥当と判断できる。

問8

[1]

① 誤り。相関が見られる。
② 誤り。負の相関関係になっている。
③ 正しい。
④ 誤り。因果関係を断定することはできない。
⑤ 誤り。降水量については記載がない。

[2]

外れ値を除外した場合に、相関係数が小さくなり①r1 > r2になる。
https://techblog.nhn-techorus.com/archives/7878
ランダムなデータでも外れ値を一つ追加することで強い相関がでる場合がある。

[3]

① 誤り。因果関係は分からない。
② 誤り。正負は分からない。
③ 正しい。
④ 誤り。ヒストグラムから予測をする事はできない。
⑤ 誤り。ヒストグラムから予測をする事はできない。

問9

I. グラフから読み取る事ができ正しい。
II. 465人なので誤り。
III. 新聞閲覧者で政治・選挙への関心なしの人数は872人で、新聞非閲覧者で政治・選挙への関心なしの人数は462人で多いので誤り。

問10

I. 小さい場合もあるので誤り。
II. 正しい。
III. 原因を特定することは重要なので誤り。

問11

I. 子供の数の男女比は2018年2019年ともに1.05では差はないので正しい。
II. 共に0.12で変化はないので誤り。
III. 2019年、2018年の総人口の割合は共に0.94なので誤り。

問12

I. 相関係数は高いが因果関係については断定できないので誤り。
II. ほとんど相関がないので誤り。
III. 相関係数の値は大きいが、記述の通り偽相関である可能性が高いので正しい。

問13

[1]

保護者が代わりに回答しているものの、視力の標本自体は小学生なので④が正しい。

[2]

①の方法が無作為抽出法として最も正しい。
https://bellcurve.jp/statistics/glossary/1449.html
https://bellcurve.jp/statistics/course/8007.html

問14

③の方法が抽出方法として最も適切である。局所管理を正しく行っている例である。
https://bellcurve.jp/statistics/course/12744.html

問15

[1]

1回目に赤玉を取り出す確率は5/7、2回目に白玉を取り出す確率は2/8、3回目に白玉を取り出す確率は3/9となり、=1/3となる。3回目に白玉を取り出す確率なので、②が正しい。

[2]

1回目に赤玉を取り出す確率は5/7、2回目に白玉を取り出す確率は2/8、3回目に白玉を取り出す確率は3/9とな、5/7 * 2/8 * 3/9で、=5/84となる。1回目から3回目まで指定通りにたまを取り出す確率なので、⑤が正しい。

[3]

1回目2回目の前提がなく、3回目に白玉を取り出す確率なので、2/7となり、①が正しい。

問16

公式を使って算出します。

\hat{β}=rxy(\frac{sy}{sx}) \\
\hat{α}=\bar{y}-\hat{β}\bar{x} \\
{y}=\hat{α}+\hat{β}x

代入します。

\hat{β}=0.94 * (\frac{1}{22}) = 0.0427 \\
\hat{α}=5.5-0.0427 * 110 = 0.803 \\
y = 0.803 * 0.0427 * 122 = 6.01 \\

④が正しい。

問17

標本平均のヒストグラムに関する問題である。
同じ調査を50回繰り返し行っているのでnの値が大きくなる。
分母のnが大きくなることから、分散が小さくなることが分かる。

 (\frac{σ^2}{n}) \\

https://www.statistics.co.jp/reference/Research_Lecture2012/average20141101.pdf
こちらのP10からの説明わかりやすい

問18

母平均がの平均や分散と分かっている場合にはそのまま利用できる。
②が正しい。

問19

I. 棄却域の幅を狭めて、信頼区間の幅を広げているので誤り。
II. 95%信頼区間を求める公式は下記のとおりである。nを大きくするか、1.96の値を小さくする以外に方法はないので正しい。
III. 誤り。

\bar{x}-1.96 \times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu \leq \bar{x}+1.96 \times \sqrt{\frac{\sigma^{2}}{n}}

問20

賛成派の人数が526人以上場合に帰無仮説を棄却する想定で、実際は534人が賛成派であったので、帰無仮説は棄却される。
また、比率を計算すると5割より高いので④が正しい。