7.3 相関行列を計算する(1)

───よし、方針は決まったわ。相関係数を計算していこう。

───えーと、まずは、バニラとストロベリーの相関係数だ。すると、次は、バニラとミルクティーね。その次は、バニラとマカダミアナッツと。その次は、バニラとクッキー……

───ええ〜、これは大変だ。1つの相関係数を求めるだけでも大変なのに、すごい組み合わせの数になる。組み合わせの数は、20+19+18+17+………+3+2+1ね。えーと、これは、210通りの組み合わせだわ。こんなの無理だわ。三ヶ島先輩。

「すべてのアイスクリームの組み合わせというのはこうなるね」

「横方向に、バニラ、ストロベリー、ミルク、………、チョコレート、あずき、と並ぶ。縦方向も同様に、バニラ、ストロベリー、ミルク、………、チョコレート、あずき、と並べる。そうすると、こんな行列ができあがる」

「そうしたところで、縦と横の項目が交わったところに、その相関係数をいれていくんだ。たとえば、バニラとストロベリーが交わったセルにはその相関係数をいれていく。対角線の部分、つまり、バニラとバニラ、ストロベリーとストロベリー、ミルクとミルクのセルには、相関係数1.0がはいる。自分自身との相関は常に1.0だからね」

「これを相関行列と呼ぶんだよ」

───でも、三ヶ島先輩、バニラとストロベリーの相関係数ひとつを計算するんでもたいへんなんですよ。平均を出して、平均からの偏差を出して、それを掛け合わせて、その平均を求めて、それを2つの標準偏差で割るんです。

「おっ、もう相関係数の算出の仕方が身についているね。すばらしい」

───そりゃもう、何度も何度も計算しましたから。

「それじゃ、ひとつ便利な方法を教えよう。相関係数を一発で求める関数だ」

=PEARSON(データ列1, データ列2)

「この関数を使えば、データ列1とデータ列2の相関係数を求めることができる。PEARSONはピアソンと発音する。これまでやってきた相関係数というのは正確には、<ピアソンの積率相関係数>と呼ばれているものなんだ」

───ええっ、そんなに便利な関数があるんですか〜。なんでそれを先に教えてくれなかったんですか〜。

「ごめん、ごめん。でも、相関係数の計算をしたおかげで、計算方法が身についたでしょ? それはさっきすらすらと計算方法を言えたことで証明されている」

「PEARSONの関数を先に教えてしまえば、確かに計算はラクになるだろうけれども、それについて何もわかったことにはならないよね。内容を理解した上で道具を使うことと、まったくのブラックボックス(中身のわからないハコ)として使うのでは、全然違うということだ」

(C) 2003 KogoLab