4.4 回帰直線を求めてみよう

じゃあ、最高気温(x)と客数(y)のデータを使って、回帰直線をもとめてみます。

まず、相関係数を求めます。

そのためには、x,yの平均と標準偏差、それから偏差、偏差積をまず計算します。

そうしてから、

相関係数=偏差積の平均/(xの標準偏差*yの標準偏差)

で相関係数を出します。

相関係数が出たら、

回帰直線の傾き=相関係数*((yの標準偏差)/(xの標準偏差))

の式で、回帰直線の傾きを出します。

次に、

y切片=yの平均−(傾き*xの平均)

の式で、y切片を出します。

───三ヶ島先輩、計算できました。傾きは、17.25、y切片は、-229.98になりました。

「ということはどういう意味かな? アイ子ちゃん」

───ええと、傾きが17.25ということは、最高気温が1度上がるごとに、お客の数が17.25人増えるということですね。

「うん、そうだね」

───そして、y切片が-229.98ということは…… え? マイナス?

「それは、数字の通りに解釈すれば、こういうことだ。最高気温が0度のとき、お客の数は-229.98人と予測できる、ということ」

───でも、お客の数がマイナスなんておかしいじゃないですか?

「そうだ。おかしいよね。でも、回帰直線は計算されてしまうので、こういうことになる。最高気温0度のときのお客の数はゼロになることはあるかもしれないが、マイナスには論理的にならないね。このように数値を計算した後には、その意味づけをよく考えることが大切なんだ」

───いずれにしても、y切片が-229.98ということは、数値としてはおかしくないのですね。

「そう。おかしくない。解釈すると妙なことになるけどね」

「たとえば、夏としては割と涼しい日である、最高気温25度の日のお客の数は、どれくらいだと予測できるかな?」

───えーと、傾き17.25に25をかけて、y切片-229.98を足せばいいんですね。そうすると、201.27人ですね。

「そうなるね。実際のデータでは、14番目のデータで、最高気温25度のとき、客数196人という実績があって、だいたい合致しているようだね」

───ほんとだ。うーん、回帰直線って、すごいですね。

(C) 2003 KogoLab