3.1 母集団と標本集団

「お願いしたいのは、このお客様アンケートを分析してほしいんだ。特に、年齢と1ヶ月当たりの来店回数の関係を知りたいんだよ」

───いつまでに、ですか?

「明日、本部で報告しなくちゃならないんだ」

───え〜、そんなの無理ですよ。500枚以上あるんでしょ?

「無理を承知で、そこをなんとか」

「店長、どうしました?」

───あ、三ヶ島先輩。店長ったら、無理なことを言うんですよ。このアンケートの山を1日で分析してくれだなんて。

「時間がないなら仕方ないですね。このアンケートから、データを抜き出して分析してはどうでしょうか」

───えぇっ! データを抜き出して分析してもいいんですか?!

母集団と標本集団

もちろん手元にあるデータ全部を使って分析をするに越したことはありません。しかし、それができないことも多いのです。

分析の対象として想定する集団を「母集団」と呼びます。たとえば、国勢調査で知ろうとしている対象は「日本に住んでいる人全体」であり、これが母集団です。

政党支持率を知りたいときの母集団は、「日本に住んでいる有権者全体」ですが、これを短い時間で調査することは不可能です。したがって、母集団の中から一定の数のデータを抜き出します。これを「標本集団」と呼びます。標本集団を選ぶことを「標本抽出」と呼びます。標本集団は「サンプル」ともいいます。また、標本抽出を「サンプリング」ということもあります。

標本抽出で大切なことは、偏りのないように、人為的な意図が入らないように抽出することです。これを「無作為抽出」(あるいは、ランダムサンプリング)と呼びます。具体的には、くじ引きをしたり、乱数表を使ったり、さいころを振ったりして標本を決めます。

店長が想定している母集団は、「このお店に来店したお客全体」であると考えられます。

一方、集められたアンケートは、そこからのサンプルであると考えられます。アンケートに答えなかったお客もいるからです。ですが、簡単のためここでは、このアンケート全体を母集団として考えていきます。

(C) 2003 KogoLab