じゃあ、最高気温(x)と客数(y)のデータを使って、回帰直線をもとめてみます。
まず、相関係数を求めます。
そのためには、x,yの平均と標準偏差、それから偏差、偏差積をまず計算します。
そうしてから、
相関係数=偏差積の平均/(xの標準偏差*yの標準偏差)
で相関係数を出します。
相関係数が出たら、
回帰直線の傾き=相関係数*((yの標準偏差)/(xの標準偏差))
の式で、回帰直線の傾きを出します。
次に、
y切片=yの平均−(傾き*xの平均)
の式で、y切片を出します。
───三ヶ島先輩、計算できました。傾きは、17.25、y切片は、-229.98になりました。
「ということはどういう意味かな? アイ子ちゃん」
───ええと、傾きが17.25ということは、最高気温が1度上がるごとに、お客の数が17.25人増えるということですね。
「うん、そうだね」
───そして、y切片が-229.98ということは…… え? マイナス?
「それは、数字の通りに解釈すれば、こういうことだ。最高気温が0度のとき、お客の数は-229.98人と予測できる、ということ」
───でも、お客の数がマイナスなんておかしいじゃないですか?
「そうだ。おかしいよね。でも、回帰直線は計算されてしまうので、こういうことになる。最高気温0度のときのお客の数はゼロになることはあるかもしれないが、マイナスには論理的にならないね。このように数値を計算した後には、その意味づけをよく考えることが大切なんだ」
───いずれにしても、y切片が-229.98ということは、数値としてはおかしくないのですね。
「そう。おかしくない。解釈すると妙なことになるけどね」
「たとえば、夏としては割と涼しい日である、最高気温25度の日のお客の数は、どれくらいだと予測できるかな?」
───えーと、傾き17.25に25をかけて、y切片-229.98を足せばいいんですね。そうすると、201.27人ですね。
「そうなるね。実際のデータでは、14番目のデータで、最高気温25度のとき、客数196人という実績があって、だいたい合致しているようだね」
───ほんとだ。うーん、回帰直線って、すごいですね。
(C) 2003 KogoLab