じゃあ、重回帰モデルを説明していこう。
その前に、単回帰モデルを思い出してみよう。最高気温で客数を予測するモデルは、
客数の予測値 = 回帰直線のy切片 + 回帰直線の傾き×最高気温
ということだったね。
これに対して、重回帰モデルでは、こう考える。
最高気温と最低気温の2つで、客数を予測するモデルを次のように考える。
客数の予測値 = 定数m + 定数p×最高気温 + 定数q×最低気温
定数mが単回帰モデルのy切片に相当し、定数pと定数qは回帰直線の傾きに相当する。
つまり、最高気温をp倍したものと、最低気温をq倍したものを足して、さらに定数mを足すと、客数の予測値になると考えるわけだ。
───でも、そんなp, q, mを求めるにはどうしたらいいんですか?
「それは、以前にやった最小2乗法を使うんだよ」
→最小2乗法について思い出そう(4章2節)
───なるほど、客数の予測値と実際の客数のずれを計算して、それを2乗した合計が最も小さくなるようにして、p, q, mを求めればいいのですね。
「そうだ。さすがだ。アイ子ちゃん」
───でも、それはどうやって計算すればいいのですか?
そう、それだ。
客数の予測値 = 定数m + 定数p×最高気温 + 定数q×最低気温
このp, q, mを求めたいわけなんだけど、このとき、
定数p = 客数と最高気温の偏回帰係数
定数q = 客数と最低気温の偏回帰係数
として求められるんだよ。
───え? 偏回帰係数でいいんですか? いまやったばかりだわ。
そう。だから準備は整っているっていったでしょ。
そして、残る定数mは次のように決められる。
定数m = 客数の平均 − p×最高気温の平均 − q×最低気温の平均
では、p, q, mを計算してみて。
───えーと、mを求めるためには、それぞれの変数の平均がいるわね。
───はい、出ました。
p = 25.96
q = -16.70
m = -90.64
になります。
「ということはどういうことかな?」
───はい。客数の予測値は、最高気温に25.96をかけたものと、最低気温に-16.70をかけたものを足して、さらに、-90.64を足す(つまり90.64を引く)ことで求められるということです。
「そうだね」
───なるほど、以前、最低気温と客数の偏相関係数がマイナスになって、びっくりしたことがあったけど、ここでも定数qがマイナスになっているわ。つまり、最低気温は高ければ高いほど客数を減らすという効果になっているということね。
(C) 2003 KogoLab