「お願いしたいのは、このお客様アンケートを分析してほしいんだ。特に、年齢と1ヶ月当たりの来店回数の関係を知りたいんだよ」
───いつまでに、ですか?
「明日、本部で報告しなくちゃならないんだ」
───え〜、そんなの無理ですよ。500枚以上あるんでしょ?
「無理を承知で、そこをなんとか」
「店長、どうしました?」
───あ、三ヶ島先輩。店長ったら、無理なことを言うんですよ。このアンケートの山を1日で分析してくれだなんて。
「時間がないなら仕方ないですね。このアンケートから、データを抜き出して分析してはどうでしょうか」
───えぇっ! データを抜き出して分析してもいいんですか?!
もちろん手元にあるデータ全部を使って分析をするに越したことはありません。しかし、それができないことも多いのです。
分析の対象として想定する集団を「母集団」と呼びます。たとえば、国勢調査で知ろうとしている対象は「日本に住んでいる人全体」であり、これが母集団です。
政党支持率を知りたいときの母集団は、「日本に住んでいる有権者全体」ですが、これを短い時間で調査することは不可能です。したがって、母集団の中から一定の数のデータを抜き出します。これを「標本集団」と呼びます。標本集団を選ぶことを「標本抽出」と呼びます。標本集団は「サンプル」ともいいます。また、標本抽出を「サンプリング」ということもあります。
標本抽出で大切なことは、偏りのないように、人為的な意図が入らないように抽出することです。これを「無作為抽出」(あるいは、ランダムサンプリング)と呼びます。具体的には、くじ引きをしたり、乱数表を使ったり、さいころを振ったりして標本を決めます。
◆
店長が想定している母集団は、「このお店に来店したお客全体」であると考えられます。
一方、集められたアンケートは、そこからのサンプルであると考えられます。アンケートに答えなかったお客もいるからです。ですが、簡単のためここでは、このアンケート全体を母集団として考えていきます。
(C) 2003 KogoLab