6.1 偏回帰係数

「以前、客数を最高気温によって予測しようとしたときに、怪奇……じゃない、回帰直線を使ったよね」

───そうです。回帰直線を使いました。

回帰直線について思い出そう(4章3節)

「偏相関についても同じように、回帰直線みたいなものが引けるんじゃないの?」

───なるほど。店長、それはいいアイデアかもしれません。でも、どうやるのかな?

「どうしました? 店長、アイ子ちゃん」

───あ、三ヶ島先輩。偏相関についてはなんとかわかったのですが、それを客数を予測するためにどうやって使えばいいのかが、わからないのです。偏相関についても、回帰直線みたいなものが引けるのでしょうか?

「おお、いいところを突いているね。説明するよ」

偏回帰係数

偏相関についても回帰直線は引ける。

たとえば、最高気温の影響を取り除いた、最低気温の残差と客数の残差の散布図は次のようになった。

だから、この散布図に対して、回帰直線を求めればいいわけだ。

だけど、いちいち残差から回帰直線を計算しなくても、次の式で回帰直線の傾きを求めることができる。これを「偏回帰係数」と呼ぶ。つまり、偏回帰直線の傾きということだ。

では、実際に偏回帰係数を計算してみよう。

Excelでの計算(式もあります)

───偏回帰係数は、-16.703 ですね。傾きはマイナスなので、右下がりの直線になります。

「そのようだ。よさそうだね」

───三ヶ島先輩。でも、y切片を出さなくていいんですか?

「うん、いいんだ。なぜなら、残差は平均0になっているので、y切片は常に0だからなんだ」

残差の散布図に回帰直線を引いてみるとこんな具合になる。

ここで、縦軸、横軸ともに平均は0で揃っているけれども、標準偏差はそれぞれにばらばらだ。そこで、それを標準偏差1で揃えてみる。

標準偏差1で揃えることのイメージを思い出そう(2章4節)

このときの偏回帰係数を「標準偏回帰係数」と呼ぶ。

標準偏回帰係数の求め方は、偏回帰係数の式の前半部分だけになる。次の通りだ。

「標準偏回帰係数を求めてみると、いくらになるかな?」

───えーと、-0.623になります。

(C) 2003 KogoLab