さて、ポテトの本数の信頼区間を計算することができたあなたは、店員さんからさらに頼まれました。
「ひとつお願いがあるんだけど。」
「なんでしょう?」
「いや、実はね、この店で売っている6個入りのチキンのことなんだけどね。最近、「分量が少ない」という苦情がはいったんだよ。チキンの形はひとつひとつ違うから、もちろん一定の重さにはならないんだけど、全体として本社基準の重さからあまりずれていると問題になるんだ。ここはひとつ信頼区間というやつで、検証できないかな?」
「できると思いますよ。そのためにはチキンの重さのデータを無作為抽出で取ることが必要です。1時間おきにひとつのチキンを標本データとして取って、その重さをはかっておいてください。」
さて、翌日、次のようなデータが手に入りました。6個入りチキンの重さのデータです。サンプルサイズは8です。
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
568 |
530 |
581 |
554 |
536 |
518 |
564 |
552 |
このデータを使って、信頼区間を計算していきましょう。
Excelを使って計算しましょう。
◇
実際に計算してみましょう。
◇
不偏分散は、分散の計算式で個数のところを(個数-1)で割ったものです。
次に、
標本標準誤差=(不偏分散/サンプルサイズ)の平方根
の式によって標本標準誤差を求めます。
最後に、
信頼区間=標本平均±t×標本標準誤差
の式によって信頼区間を求めます。
ここでtは、t分布表を見て調べます。自由度は、サンプルサイズから1を引いたものですので、7になります。
t分布表(一部)
自由度 |
確率95% |
確率99% |
1 |
12.706 |
63.657 |
2 |
4.303 |
9.925 |
3 |
3.182 |
5.841 |
4 |
2.776 |
4.604 |
5 |
2.571 |
4.032 |
6 |
2.447 |
3.707 |
7 |
2.365 |
3.499 |
8 |
2.306 |
3.355 |
9 |
2.262 |
3.250 |
10 |
2.226 |
3.169 |
計算した値から何がわかるかを書いてみましょう。特に、母集団のチキンの平均重量を推定するということに焦点を当てて書いてみましょう。
さて、あなたの計算結果はどうなりましたか。私の計算では、次のようになりました(小数点以下1,2位を四捨五入)。
平均= 550.4
不偏分散= 445.7
標本標準誤差= 7.46
自由度は(8-1)で7です。その時の
確率95%のt= 2.365
確率99%のt= 3.499
95%信頼区間=550.4±2.365×7.46 =532.7〜568.0
99%信頼区間=550.4±3.499×7.46 =524.3〜576.5
これらの値から何がわかるかを次のように書いてみました。
・標本の平均と不偏分散と標本標準誤差から何がわかるか
標本のチキンの重さの平均は、550.4であった。これは母平均の推定値として使うことができる。また、不偏分散は、445.7であった。これは母分散の推定値として使うことができる。
標本標準誤差は7.46であった。これは、母集団から8個のデータを何度も取り出して、その平均を計算したとき、その平均値の分布の標準偏差の推定値になる。
・95%信頼区間と99%信頼区間の値から何がわかるか?
95%信頼区間は532.7〜568.0であった。これは、この範囲内に母平均が含まれる確率が95%であることを示している。
99%信頼区間は524.3〜576.5であった。これは、この範囲内に母平均が含まれる確率が99%であることを示している。
いかがでしたか。
では、通過テストにチャレンジしましょう。