2.4 相関係数の意味(2)

───三ヶ島先輩、散布図の形によって偏差積和がプラスになったりマイナスになったりすることはわかりました。

───でも、計算では、偏差積和の平均を取った後で、さらにそれをXとYの標準偏差で割っていますよね。

「そうだ。もう少しだけ説明を続けるね」

偏差積和を平均して標準偏差で割るわけ

まず、偏差積和を平均するということだけど、これは、データの個数の影響を取り除いているということ。偏差積和だけだと、データの数が大きくなるとそれにつれて値が大きくなってしまう(負の相関の時は小さくなってしまう)。したがって、偏差積和をデータ個数で割るわけだ。

次に、Xの標準偏差とYの標準偏差で割るということだけど、これは、Xについても、Yについても、標準偏差を1に揃えるということになるんだ。

イメージで描くと、このようになるかな。

───この図を見てみると、先に、すべてのデータを平均0、標準偏差1に揃えておいてから、掛け合わせてもいいような気がしますね。三ヶ島先輩。

「そうなんだよ。それでも相関係数が計算できるんだ。同じ事なんだよ。そして、この結果として、相関係数が-1から+1の間になるというわけなんだ」

相関係数が1になるケースは、このように、完全に一直線で右上がりになるときなんだ。

逆に、相関係数が-1になるケースは、このように、完全に一直線で右下がりになるときなんだ。

───三ヶ島先輩、直線の傾きは関係ありますか?

「いや、関係ないんだ。傾きに関係なく、右上がりなら相関係数は1、右下がりなら相関係数は-1になる。これは標準偏差を1にすることで調整されているからだ。ただし、完全に90度(つまり垂直)や180度(つまり水平)の直線の場合は、相関係数はゼロになるよ」

(C) 2003 KogoLab