4.2 平均差の信頼区間

5点差の信頼区間

ワクワクバーガーの評価点の平均と、モグモグバーガーの評価点の平均とでは、5点の差がありました。この5点がどれくらい信頼できるものかを考えるために、その信頼区間を求めてみましょう。

信頼区間を思い出そう

その前に「信頼区間」の章で学んだ信頼区間について思い出しましょう。信頼区間を求めるには次のようにするのでした。

信頼区間=標本平均±t×標本標準誤差

ここで、tは、自由度(=標本数−1)で決まるt分布の95%(あるいは99%)の値です。

標本標準誤差は、標本平均の標準偏差のことです。

また、標本平均の分散は、母分散を標本数で割ったものでした。

母分散は実際にはわかりませんので、不偏分散で推定します。不偏分散は、分散の計算式の中で「個数」で割るところを「個数−1」で割ったものでした。

不偏分散=((データ−平均値)の二乗)の総和/(個数−1)

そうすると、標本標準誤差は次のようになります。

標本標準誤差=sqrt(不偏分散/標本数)

信頼区間を差に適用してみる

さて、信頼区間を思い出したところで、これを「平均値の差」に適用することを考えます。

いま、母集団Aと母集団Bを考えます。それぞれの母集団から同じ大きさの標本Aと標本Bを抽出します。そして、それぞれの標本について、標本平均と標本分散を計算します。

以上の抽出と計算を何回も繰り返します。

その結果、標本平均Aと標本平均Bの差の分布はどうなるかということを問題にします。この分布はt分布にしたがい、信頼区間を求める式がそのまま使えます。

平均の差の信頼区間=(標本平均A−標本平均B)±t×差の標本標準誤差

ここで問題なのは「差の標本標準誤差」をどうやって求めるかです。

標本平均Aの分散は、(母分散A/標本数A)で求まります。同様に、標本平均Bの分散は、(母分散B/標本数B)で求まります。それでは、その差である(標本平均A−標本平均B)の分散はどうなるでしょうか。これは(母分散A/標本数A)と(母分散B/標本数B)を足したものになります。これは、2つの標本が互いに独立だからです。

上での母分散はすべて不偏分散で推定しますので、差の標本標準誤差は次の式になります。

差の標本標準誤差=sqrt((不偏分散A/標本数A)+(不偏分散B/標本数B))

ここで、AとBの母分散は等しいとして、「推定母分散」と表記すると、

差の標本標準誤差=sqrt((推定母分散/標本数A)+(推定母分散/標本数B))

        =sqrt(推定母分散×((1/標本数A)+(1/標本数B))

推定母分散は次の式で推定します。これは不偏分散を求める方法と同じで、平均からの偏差の平方和を(標本数−1)で割ったものに相当します。

推定母分散=(標本Aの平均からの偏差の平方和+標本Bの平均からの偏差の平方和)/((標本数A−1)+(標本数B−1))

これで平均の差の信頼区間が計算できます。

差の信頼区間を計算してみる

それでは、実際に差の信頼区間を計算してみましょう。

ワクワクバーガーの評価点の標本分散=49.61
 その平均からの偏差の平方和=49.61×8

モグモグバーガーの評価点の標本分散=55.86
 その平均からの偏差の平方和=55.86×8

推定母分散=(49.61×8+55.86×8)/((8-1)+(8-1))
     =60.27

差の標本標準誤差=sqrt(60.27×((1/8)+(1/8)))
        =3.88

したがって差の信頼区間は、

差の信頼区間=標本平均の差±t×差の標本標準誤差
      =-5.00±t×3.88

ここで、自由度は(標本数A−1)+(標本数B−1)で、14になります。自由度14のときの95%のtの値は、2.145ですので、

差の信頼区間=-5.00±2.145×3.88
      =-5.00±8.33
      =-13.33〜3.33

つまり、差の95%信頼区間は、-13.33から3.33の間ということになりました。

これはどう解釈すればいいのでしょうか。

差の信頼区間の解釈

ワクワクバーガーとモグモグバーガーの評価点の差は、5点でした。しかし、この95%信頼区間を求めてみると、-13.33から3.33の間であるということがわかりました。これは、この範囲内に、95%の確率で母集団の平均の差が含まれているということです。

ということは、

という場合がすべて含まれているということになります。とりわけ、差が0という場合が含まれているということに注目します。これは次のことを意味します。

ワクワクバーガーとモグモグバーガーの評価点の差は、5点でした。しかし、その信頼区間には、0点が含まれていました。つまり、母集団においてその差が0点であること、つまりワクワクバーガーとモグモグバーガーの評価には差がないということが、十分起こり得ることだと解釈できます。

したがって、この5点の差は、意味のある差、つまり有意な差であるとは認められないということになります。

これが、差の信頼区間を計算した結果の解釈になります。