1.3 散布図のパターン

───店長、このグラフを見てください。最高気温と客数の間には、関係がありますね。最高気温が高くなればなるほど、客数は多くなるんですよ。

「おお、なるほど。確かに右上がりのグラフになっているね。ということは……」

───ということは?

「ということは、その日の最高気温がどれくらいになるかがわかれば、客数がだいたい予想できるということじゃないか?」

───あー、確かにそうですね。すてき。

散布図のパターン

散布図のパターンには、何種類かあります。

まず、ここで出てきた「X軸(横軸)の値が大きくなればなるほど、Y軸(縦軸)の値も大きくなるようなデータ」です。これを「正の相関」があるといいます。相関とは「お互いに関係がある」という意味です。グラフではこのようになります。

次に、それとは逆に「X軸の値が大きくなればなるほど、Y軸の値は小さくなるようなデータ」です。これを「負の相関」があるといいます。グラフではこのようになります。

最後に、正の相関も負の相関もないもの、つまり「無相関」です。「X軸の値と、Y軸の値に明確な関係がない」ということです。グラフではこのようになります。

散布図をよく見よう

「この散布図を使って、だいたいの客数が予想できるな。よし。もしその日の最高気温が30度だったら…… あれ?」

───店長、どうしました?

「アイ子ちゃん、この散布図の30度のところを見るとね。このデータグループと、このデータグループが分かれているみたいなんだよ。これはなぜかなあ?」

───ちょっと調べてみます。ふむふむ。これは、曜日による影響ですね。上のグループは、土曜と日曜のデータなんですよ。それで、下のグループは、平日のデータ。だから、土日か、平日かによって、予想が変わってきますね。

「なるほどー。散布図を描いてからも、データをよく見なくちゃいけないね」

───そうですね。常にデータに立ち戻って調べることが大切ですね。

(C) 2003 KogoLab