7.1 2つの要因では?

要因と水準

観測データに影響を与えそうな原因を「要因」と呼びます。この場合、クリスピーか普通の衣かという「食感」は、お客さんの好みに影響を与えそうなので、要因としてとらえられます。

また、要因の中の条件の違いのことを「水準」と呼びます。この場合は、食感がクリスピーであるか、普通の衣であるかということです。

表にしてみると次のようになります。

要因
水準1
水準2
食感
クリスピー
普通の衣

また、同じように考えると、辛口か普通味かという「味付け」も要因としてとらえられます。

この要因の水準は、辛口か普通味かということになります。次の表のようになります。

要因
水準1
水準2
味付け
辛口
普通味

つまり、要因が2つあるということです。それぞれの要因について、2つの水準がありますので、次の表のように、全部で4種類のチキンが考えられます。

食感の要因
クリスピー
普通の衣
味付けの要因
辛口
普通味
辛口
普通味
種類(条件)
クリスピーで辛口
クリスピーで普通味
普通の衣で辛口
普通の衣で普通味

ところで、前の6章では、要因はお店の違いでした。そして、水準は、ワクワク、モグモグ、パクパクの3つがありました。こんな感じです。

要因
水準1
水準2
水準3
お店の違い
ワクワク
モグモグ
パクパク

これを「1要因の分散分析」と呼びます。要因が1つだからです。

今回の分散分析は、「2要因の分散分析」です。要因が2つだからです。

データを集める

さて、店員さんに4種類のチキンをそれぞれ15個ずつ作ってもらい、街の人60人に食べてもらい、そのおいしさについて100点満点で点数をつけてもらいました。

そのデータは次のようになりました。

クリスピー
普通の衣
辛口
普通味
辛口
普通味
65 65 70 70
85 70 65 70
75 80 85 85
85 75 80 80
75 70 75 65
80 60 65 75
90 65 75 65
75 70 60 85
85 85 85 80
65 60 65 60
75 65 75 70
85 75 70 75
80 70 65 70
85 80 80 80
90 75 75 85

それぞれの平均と標準偏差を計算してみましょう。

食感の要因
クリスピー
普通の衣
味付けの要因
辛口
普通味
辛口
普通味
データ数
15 15 15 15
平均
       
標準偏差
       

データの入ったExcelシートをダウンロードする

計算すると次のようになります。

食感の要因
クリスピー
普通の衣
味付けの要因
辛口
普通味
辛口
普通味
データ数
15 15 15 15
平均
79.67 71.00 72.67 74.33
標準偏差
7.63 7.12 7.50 7.72

ズレの分解

前回の1要因の分散分析の場合は、ズレを次のように分解しました。

 

このように考えて、全体の平均からのズレを、群間のズレと群内のズレに分解しました。

全体の平均からのズレ = 群間のズレ + 群内のズレ

ということです。

さて、今回は、要因が2つあるので、ちょっと複雑になります。

要因が2つありますので、食感の要因(クリスピーか普通の衣か)によるズレと、味付けの要因(辛口か普通味か)によるズレが考えられます。

全体の平均からのズレ = 食感の要因によるズレ + 味付けの要因によるズレ + 残りのズレ(残差)

となります。残りのズレのことを「残差」と呼びましょう。これは1要因の分散分析では「群内のズレ」に当たります。

また、1つの要因の単独の効果を「主効果」といいます。ここでは、食感の要因による主効果と、味付けの要因による主効果の2つの主効果があります。

交互作用

ズレはこの3つだけで良いでしょうか?

いえ、不足しています。たまたま、食感(クリスピーか普通の衣)にかかわらず、味付けの要因によるズレが一定ならば、この式であっています。しかし、そうでないことも多いのです。

つまり、「食感の要因と味付けの要因の2つが組み合わさって生じるズレ」を考える必要があります。ちょっとわかりにくいですが、こう考えてください。

組み合わせによるズレを式にいれてみると、次のようになります。

全体の平均からのズレ = 食感の要因によるズレ + 味付けの要因によるズレ + 食感の要因と味付けの要因の組み合わせによるズレ + 残りのズレ(残差)

2つの要因の組み合わせによって起こる効果を「交互作用」といいます。

もっと簡単に書き直すと次のようになります。

全体のズレ = 要因1によるズレ + 要因2によるズレ + 交互作用によるズレ + 残りのズレ(残差)

交互作用については、重要ですので、あとでもう一度説明します。

2要因の分散分析

2要因の分散分析の考え方を説明します。

全体のズレ = 要因1によるズレ + 要因2によるズレ + 交互作用によるズレ + 残りのズレ(残差)

ということなので、残りのズレ(残差)を規準にして、要因1によるズレ、要因2によるズレ、交互作用によるズレの3つの大きさを検討します。

2要因の分散分析の帰無仮説は、

要因1による差がなく、要因2による差がなく、また交互作用による差もない

となります。

そうすると対立仮説はその否定で、

要因1による差があるか、要因2による差があるか、または、交互作用による差があるか、どれか1つが成り立つ

となります。

これは、具体的には、次のような7つの場合があります。

これを検定するのが、2要因の分散分析ということになります。