2.2 相関係数

「店長、どうしました? アイ子ちゃんも考え込んじゃって」

「ああ、三ヶ島くん。このグラフを見てよ。右上がりは同じだけどばらつきが違うでしょ。これを数字で表せないかな、と思っているんだけど」

「なるほど、相関の強さを数字で表すということですね。それなら相関係数というのがありますよ」

「なに〜、相関係数だって? そんなのがあるのか。それに、なんで君がそんなことを知っているのだ?」

「あはは、こう見えても大学院生ですからね」

───三ヶ島先輩、その相関係数というのを教えていただけますか?

「データはもうExcelに入っているんだね。じゃあ、そこからスタートしよう」

相関係数を計算しよう

1. ファイルを開く

「客数データ.xls」のファイルを開きます。

ここでは、「最高気温」をX、「客数」をYとします。

2. X, Yの平均と標準偏差を求める

XとYの平均と標準偏差を計算式によって求めます。

平均と標準偏差って何?

平均は、全体の合計を個数で割ったものです。Excelでは、「=average(セル:セル)」という式で求められます。ここで「セル:セル」と書いたのは、たとえば「B61:B70」のように平均を求める範囲を指定したものです。

標準偏差は、データのばらつきを表したものです。具体的には、それぞれのデータの平均からの差の二乗をすべて合計したものを個数で割り(これが「分散」)、そのルートをとったものです。Excelでは、「=stdevp(セル:セル)」という式で求められます。ここで「セル:セル」と書いたのは、たとえば「B61:B70」のように標準偏差を求める範囲を指定したものです。

Xの平均と標準偏差の式は次のようになります。式を入力してリターンキーを押すと、自動的に計算され、その計算結果がセルに表示されます。

なお、ここではデータの範囲は「B61:B70」となっていますが、この値は皆さんがワークシートのどこにデータを入れたかによって変わってきますので、確認して指定してください。

同様にして、Yの平均と標準偏差の計算式を入れてください。

3. 偏差を求める

Xの平均からの差(偏差と呼びます)を、計算します。

まずひとつ目の式を、D61に書きます。計算式は、「=B61-B$71」です。ここで、B61は元のデータ、B71は平均値です。71の前に入っているドルマーク「$」は、この後行う式のコピーで、71を「動かさない」というおまじないです。リターンを押すと、自動的に計算結果が表示されます。

同じようにD62以下も式を入れるのですが、数が多いと大変です。そこで、式のコピーという方法を使います。

まず、D61をクリックして選択します。その後、選択部分の右下隅にマウスカーソルを移動させ、カーソルが変化したときに、下方向にドラッグします。ここは微妙な操作ですので、何度かトライしてください。コピーがうまく行くと、次のようになります。

同じように、Yの平均偏差についても式を入れて、計算します。

4. 偏差積を求める

Xの平均偏差とYの平均偏差を掛け合わせたものを計算します(これを偏差積と呼びます)。

F61のセルに、式「=D61*E61」を入れます。「*」はかけ算の印です。

式を縦方向にコピーします。

次のようになります。

5. 偏差積の平均を求める

偏差積の平均を計算します。F71に入れる式は、「=average(F61:F70)」となります。

6. 偏差積の平均をX, Yの標準偏差で割れば相関係数が出る

最後に、相関係数を求めます。偏差積の平均をX, Yの標準偏差で割ります。式は「=F71/(B72*C72)」です。

次のようになればOKです。

(C) 2003 KogoLab