4.3 t検定

仮説検定

さて、ワクワクバーガーとモグモグバーガーの味の評価の間に意味のある差(有意差)があるかどうかを決める方法を考えていきましょう。

そのためには、前の章で説明した仮説検定の考え方を使います。

仮説検定の考え方は次のようなものです。

指標tの性質

今、2つの母集団A,Bを考えます。AもBも、だいたい正規分布にしたがっており、平均値が等しく、分散もほぼ等しいとします。

その2つの母集団A,BそれぞれからNA, NB個の標本を取り出してきます。それを標本集団A,Bとします。

標本集団A,Bのそれぞれの平均値を計算して、それを標本平均A,Bとします。

標本平均Aと標本平均Bの差を計算します。すると、これは0に近い場合が多いと考えられます。なぜなら、もともとの母集団A,Bの平均値が等しいからです。そこから取り出した標本集団A,Bの平均値もお互いに近い場合が多いのではないかと推測できます。

そこで、次のような指標tを考えます。

t=(標本平均の差)/(標本平均の差の標準誤差)

すると、このtは、自由度(NA+NB-2)のt分布に従うことが知られています。

標本平均の差の標準誤差は、前の節でやったように、次の式で推定します。

標本平均の差の標準誤差=sqrt((Aの不偏分散/Aの標本数)+(Bの不偏分散/Bの標本数))

ここで、AとBの母分散は等しいとして、「推定母分散」と表記すると、

差の標本標準誤差=sqrt((推定母分散/標本数A)+(推定母分散/標本数B))

        =sqrt(推定母分散×((1/標本数A)+(1/標本数B))

推定母分散は次の式で推定します。これは不偏分散を求める方法と同じで、平均からの偏差の平方和(これは分散を求めるときの((データ−平均値)の2乗)の総和のことです)を(標本数−1)で割ったものに相当します。

推定母分散=(標本Aの平均からの偏差の平方和+標本Bの平均からの偏差の平方和)/((標本数A−1)+(標本数B−1))

まとめると、

t=(標本平均の差)/sqrt(推定母分散×((1/標本数A)+(1/標本数B))

推定母分散=(標本Aの平均からの偏差の平方和+標本Bの平均からの偏差の平方和)/((標本数A−1)+(標本数B−1))

となります。

指標tを計算してみよう

それでは、実際にワクワクバーガーの評価点とモグモグバーガーの評価点について、tを計算してみましょう。

まず、標本平均の差は、

標本平均の差=76.88-81.88
      =-5.00

次に、差の標準誤差を求めます。

ワクワクバーガーの評価点の標本分散=49.61
 その平均からの偏差の平方和=49.61×8

モグモグバーガーの評価点の標本分散=55.86
 その平均からの偏差の平方和=55.86×8

推定母分散=(49.61×8+55.86×8)/((8-1)+(8-1))
     =60.27

差の標本標準誤差=sqrt(60.27×((1/8)+(1/8)))
        =3.88

そうすると、tはこうなります。

t=-5.00/3.88
 =-1.29

Excelで計算してみましょう。

ここでは、次のような関数を使っています。

このExcelシートをダウンロードする

Excelの関数については、その意味が理解できていれば、積極的に使ってかまいません。

t分布表を見る

さて、t=-1.29となりました。この値はどのくらいの確率で起こるのでしょうか。

それを調べるためには、t分布表を使います。

t分布は自由度によって少しずつ変わってきます。t検定の場合は、(標本数A-1)と(標本数B-1)を足したものが自由度になります。この場合、標本数Aも、標本数Bも8でしたので、(8-1)+(8-1)で、自由度は14になります。

それでは、t分布表の自由度14のところを見てください。

t分布表

自由度
有意水準5%
有意水準1%
1
12.706
63.657
2
4.303
9.925
3
3.182
5.841
4
2.776
4.604
5
2.571
4.032
6
2.447
3.707
7
2.365
3.499
8
2.306
3.355
9
2.262
3.250
10
2.226
3.169
11
2.201
3.106
12
2.179
3.055
13
2.160
3.021
14
2.145
2.977
15
2.131
2.947
16
2.120
2.921
17
2.110
2.898
18
2.101
2.878
19
2.093
2.861
20
2.086
2.845
21
2.080
2.831
22
2.074
2.819
23
2.069
2.807
24
2.064
2.797
25
2.060
2.787
26
2.056
2.779
27
2.052
2.771
28
2.048
2.763
29
2.045
2.756
30
2.042
2.750
40
2.021
2.704
60
2.000
2.660
120
1.980
2.617
1.960
2.576

自由度14において、有意水準5%のtは2.145、有意水準1%のtは2.977と書いてあります。

これは次のことを意味しています。

自由度14のときのt分布を描いてみると、tが2.977よりも大きい、または-2.977よりも小さいことが起こる確率が1%未満であるということを示しています。

また、tが2.145よりも大きい、または-2.145よりも小さいことが起こる確率が5%未満であるということを示しています。

tが2.977よりも大きい、または-2.977よりも小さい部分を、1%有意水準での棄却域と呼びます。

同様に、tが2.145よりも大きい、または-2.145よりも小さい部分を、5%有意水準での棄却域と呼びます。

t検定の考え方

いま、有意水準を5%に設定したとすると、tが2.145よりも大きいか、-2.145よりも小さければ(棄却域に入っている)、それが起こる確率は5%未満なので、2つの母集団の平均、つまりワクワクとモグモグの評価点の平均には差がないとした帰無仮説が棄却されます。結論としては、ワクワクとモグモグの評価点の平均には差がないとはいえない、つまり、差があるということになります。

さて、計算したtは、-1.29でしたので、5%有意水準での棄却域には入っていません。したがって帰無仮説は棄却できません。結論としては、ワクワクとモグモグの評価点の平均には差がないということになります。

これでt検定が完成しました。

t検定の手続き

もう一度、t検定の手続きをまとめてみましょう。

1. 帰無仮説を立てる:

「ワクワクバーガー(全体)とモグモグバーガー(全体)のおいしさの評価点には差がない」

2. 帰無仮説の否定である対立仮説を立てる:

「ワクワクバーガー(全体)とモグモグバーガー(全体)のおいしさの評価点には差がないとはいえない、つまり、差がある」

3. 有意水準を決める

通常は、厳しくて1%、少し甘くて5%

4. 得られた標本を使って、指標tを計算する:

t=(標本平均の差)/sqrt((Aの不偏分散/Aの標本数)+(Bの不偏分散/Bの標本数))

5. 標本の数から自由度を計算する:

自由度=(Aの標本数−1)+(Bの標本数−1)=Aの標本数+Bの標本数−2

6. t分布表の該当する自由度のところを見て、求めたtが棄却域にはいっているか、いないかを判定し、帰無仮説を棄却するか、採択するかを決める

もしtが棄却域に入っていなければ、帰無仮説を採択する

もしtが棄却域に入っていれば、帰無仮説を棄却し、対立仮説を採択する

7. 結論を決める

帰無仮説を採択した場合は、「ワクワクバーガー(全体)とモグモグバーガー(全体)のおいしさの評価点には差がない」

対立仮説を採択した場合は、「ワクワクバーガー(全体)とモグモグバーガー(全体)のおいしさの評価点には差がないとはいえない、つまり、差がある」

以上がt検定の手続きです。