8.1 因子分析の考え方

───21種類のアイスクリームを地図のように配置するのか……。確かに相関行列だけでは、一目で見てわかりやすいということにはならないわね。どうしたらいいのかしら。

「どうしたのアイ子ちゃん。むずかしい顔をして」

───あ、三ヶ島先輩。アイスクリームの好みについての相関行列まではできたんですけれど、これではまだわかりにくいので、地図のようにできないか、と店長がおっしゃるんですよ。

「なるほど。そのためには、因子分析を使えばいいんだよ」

───因子分析ですか? うわー、なんか難しそうですね。

「変数がたくさんある、多変量データを分析する方法はいろいろあるけれども、因子分析はその中でも最もよく使われるもののひとつだ。これをマスターしておくと、これからきっと役に立つことがあると思うよ」

───三ヶ島先輩、ぜひ、それを教えてください。

因子分析の考え方

まず最初に、因子分析の考え方を説明しよう。

ここでは簡単のために、21種類のアイスクリームから、マカダミアナッツ、チョコレート、ウォールナッツ、チョコチップの4種類のアイスクリームのデータだけを考えることにするよ。

この4種類の相関行列は、こうなっている。

マカダミアナッツとウォールナッツの相関が高くて、チョコレートチョコチップの相関も高い。

この現象について、因子分析では、マカダミアナッツとウォールナッツに対してひとつの因子が共通に働いていると考える。同様に、チョコレートチョコチップにもまた別の因子が共通に働いていると考える。この因子のことを「共通因子」と呼んでいる。イメージにするとこうなる。

「ナッツの共通因子」というものがあるとすれば、それがマカダミアナッツとウォールナッツに働いているので、マカダミアナッツとウォールナッツの相関が高くなるという考え方だ。同様に、「チョコの共通因子」というものがあるとすれば、それがチョコレートとチョコチップに働いているので、チョコレートとチョコチップの相関が高くなるわけだ。

共通因子に対して、マカダミアナッツやチョコレートの好みなどの変数を「観測変数」と呼んでいる。実際に観測されたデータという意味だ。

───共通因子と観測変数の関係は、前にやった偏相関にちょっと似ていますね。

「そうだね。偏相関の場合は、共通因子も実際に観測されたデータだったけれども、この3つの変数の関係は偏相関に似ている。つまり、共通因子があるために、それが働いている観測変数同士の相関が高くなる、という考え方だ」

───でも、因子分析では、共通因子は実際のデータではないんですね。

「そうだ。あくまでも仮想的なものだよ。そして、その共通因子を求めることが因子分析という統計手法なんだ」

(C) 2003 KogoLab