観測データに影響を与えそうな原因を「要因」と呼びます。この場合、クリスピーか普通の衣かという「食感」は、お客さんの好みに影響を与えそうなので、要因としてとらえられます。
また、要因の中の条件の違いのことを「水準」と呼びます。この場合は、食感がクリスピーであるか、普通の衣であるかということです。
表にしてみると次のようになります。
要因 |
水準1 |
水準2 |
食感 |
クリスピー |
普通の衣 |
また、同じように考えると、辛口か普通味かという「味付け」も要因としてとらえられます。
この要因の水準は、辛口か普通味かということになります。次の表のようになります。
要因 |
水準1 |
水準2 |
味付け |
辛口 |
普通味 |
つまり、要因が2つあるということです。それぞれの要因について、2つの水準がありますので、次の表のように、全部で4種類のチキンが考えられます。
食感の要因 |
クリスピー |
普通の衣 |
||
味付けの要因 |
辛口 |
普通味 |
辛口 |
普通味 |
種類(条件) |
クリスピーで辛口 |
クリスピーで普通味 |
普通の衣で辛口 |
普通の衣で普通味 |
ところで、前の6章では、要因はお店の違いでした。そして、水準は、ワクワク、モグモグ、パクパクの3つがありました。こんな感じです。
要因 |
水準1 |
水準2 |
水準3 |
お店の違い |
ワクワク |
モグモグ |
パクパク |
これを「1要因の分散分析」と呼びます。要因が1つだからです。
今回の分散分析は、「2要因の分散分析」です。要因が2つだからです。
さて、店員さんに4種類のチキンをそれぞれ15個ずつ作ってもらい、街の人60人に食べてもらい、そのおいしさについて100点満点で点数をつけてもらいました。
そのデータは次のようになりました。
|
|
||
|
|
|
|
65 | 65 | 70 | 70 |
85 | 70 | 65 | 70 |
75 | 80 | 85 | 85 |
85 | 75 | 80 | 80 |
75 | 70 | 75 | 65 |
80 | 60 | 65 | 75 |
90 | 65 | 75 | 65 |
75 | 70 | 60 | 85 |
85 | 85 | 85 | 80 |
65 | 60 | 65 | 60 |
75 | 65 | 75 | 70 |
85 | 75 | 70 | 75 |
80 | 70 | 65 | 70 |
85 | 80 | 80 | 80 |
90 | 75 | 75 | 85 |
それぞれの平均と標準偏差を計算してみましょう。
|
|
|
||
|
|
|
|
|
|
15 | 15 | 15 | 15 |
|
||||
|
計算すると次のようになります。
|
|
|
||
|
|
|
|
|
|
15 | 15 | 15 | 15 |
|
79.67 | 71.00 | 72.67 | 74.33 |
|
7.63 | 7.12 | 7.50 | 7.72 |
前回の1要因の分散分析の場合は、ズレを次のように分解しました。
このように考えて、全体の平均からのズレを、群間のズレと群内のズレに分解しました。
全体の平均からのズレ = 群間のズレ + 群内のズレ
ということです。
さて、今回は、要因が2つあるので、ちょっと複雑になります。
要因が2つありますので、食感の要因(クリスピーか普通の衣か)によるズレと、味付けの要因(辛口か普通味か)によるズレが考えられます。
全体の平均からのズレ = 食感の要因によるズレ + 味付けの要因によるズレ + 残りのズレ(残差)
となります。残りのズレのことを「残差」と呼びましょう。これは1要因の分散分析では「群内のズレ」に当たります。
また、1つの要因の単独の効果を「主効果」といいます。ここでは、食感の要因による主効果と、味付けの要因による主効果の2つの主効果があります。
ズレはこの3つだけで良いでしょうか?
いえ、不足しています。たまたま、食感(クリスピーか普通の衣)にかかわらず、味付けの要因によるズレが一定ならば、この式であっています。しかし、そうでないことも多いのです。
つまり、「食感の要因と味付けの要因の2つが組み合わさって生じるズレ」を考える必要があります。ちょっとわかりにくいですが、こう考えてください。
組み合わせによるズレを式にいれてみると、次のようになります。
全体の平均からのズレ = 食感の要因によるズレ + 味付けの要因によるズレ + 食感の要因と味付けの要因の組み合わせによるズレ + 残りのズレ(残差)
2つの要因の組み合わせによって起こる効果を「交互作用」といいます。
もっと簡単に書き直すと次のようになります。
全体のズレ = 要因1によるズレ + 要因2によるズレ + 交互作用によるズレ + 残りのズレ(残差)
交互作用については、重要ですので、あとでもう一度説明します。
2要因の分散分析の考え方を説明します。
全体のズレ = 要因1によるズレ + 要因2によるズレ + 交互作用によるズレ + 残りのズレ(残差)
ということなので、残りのズレ(残差)を規準にして、要因1によるズレ、要因2によるズレ、交互作用によるズレの3つの大きさを検討します。
2要因の分散分析の帰無仮説は、
「要因1による差がなく、要因2による差がなく、また交互作用による差もない」
となります。
そうすると対立仮説はその否定で、
「要因1による差があるか、要因2による差があるか、または、交互作用による差があるか、どれか1つが成り立つ」
となります。
これは、具体的には、次のような7つの場合があります。
これを検定するのが、2要因の分散分析ということになります。