1.4 分散と標準偏差

分散と標準偏差

さて、分散を求める式をもう一度よく見てみると、

分散=((データ−平均値)の2乗)の総和÷個数

この式のなかで2乗になっているので、単位はcmの2乗になります。元々のデータは長さの単位(cm)だったのに、分散の値はその2乗になっているわけです。

そこで、単位をそろえるためには、分散の値の平方根(ルート)をとればいいということになります。分散のルートを標準偏差と呼びます。式では、

標準偏差=(分散)の平方根

となります。

標準偏差のことを英語で、standard deviation といいます。頭文字をとって、SDと表記します。

分散と標準偏差を計算する

それでは、データのばらつきを示す数値である、分散と標準偏差をExcelで計算してみましょう。

1. 見出しを入れる

Excelのシートを開き、C1とD1にそれぞれ、「平均からの差」と「その2乗」と入れます。

2. 平均からの差の式を入れる

C2に平均からの差の式を入れます。

式は「=B2-B$52」です。「=」は式の印。「B2」には長さ3.5がはいっています。「B$52」には平均の式が入っています。「$(ドルマーク)」はおまじないで、次に説明します。

式を入れるとすぐに計算された値が表示されます。ここでは、-1.07142…という値になります。

3. 式をコピーする

さて、この式を個数分(49個!)入れなくてはならないとなると、めんどうです。そこでコピー機能を使います。

まず、コピー元であるC2を選択します。

枠の右下の小さな■にマウスカーソルを合わせるとカーソルが十字から四角に変化します。

マウスボタンを押したまま、下にドラッグします。C50のセルまでドラッグしてください。下の図ではC6までドラッグした途中です。

マウスボタンをはなすと、式がコピーされ、すぐに値が表示されます。

確認のため、C6のセルをクリックしてみると、ちゃんと式がコピーされていることがわかります。式はC2のもの(=B2-B$52)が「そのまま」コピーされるのではなく、「B2」が「B6」になっているように、セルに合わせて番号がずれています。しかし、「B$52」は「B$52」のままです。この「$」は「コピーしても番号をずらさない」という印だったのです。

4. 2乗の式を入れる

D2に2乗の式を入れます。

式は「C2^2」です。「C2」は平均からの差の値が入っています。「^2」は2乗の意味です。

式を入れるとすぐに値が表示されます。

5. 2乗の式をコピーする

さきほどの式のコピーと同じようにD2の式を、D50までコピーしてください。

6. 2乗の合計を計算する

D51に2乗の合計の式を入れます。

式は「=SUM(D2:D50)」です。

7. 分散を計算する

D52に2乗の平均の式を入れます。これが分散になります。

式は「=AVERAGE(D2:D50)」です。

8. 標準偏差を計算する

D53に2乗の平均のルートの式を入れます。これが標準偏差になります。

式は「=SQRT(D52)」です。「SQRT」はルートの意味です。

モグモグバーガーの分散と標準偏差を計算する

それでは次に、モグモグバーガーのポテトの長さの分散を計算しましょう。

Excelで計算しましょう

結果を確認しましょう

さて、あなたの計算結果はどうなったでしょうか。

私の計算では次のようになりました。小数点以下第3位で四捨五入してあります。

ワクワクバーガーのポテトの長さの分散は 0.68、標準偏差は 0.83

モグモグバーガーのポテトの長さの分散は 2.58、標準偏差は 1.61

となりました。これを見ると、度数分布図でばらつきの大きかったモグモグバーガーのポテトの長さの分散と標準偏差は、ワクワクバーガーのものよりも大きいことがわかります。

つまり、「度数分布図でのばらつきが大きければ、分散と標準偏差も大きくなる」という関係が成り立っていることが確認できます。

それでは、ここまでの内容をまとめてみましょう。

まとめ――平均、度数分布、分散、標準偏差

あるデータの集団を代表の値として平均を用いることが多い。

平均=データの総和÷個数

平均に違いがなくても、データのちらばり具合は異なることがある。

データのちらばり具合を見るためには、度数分布図を描く。

データのちらばり具合を示す数値として、分散や標準偏差を用いる。

分散=((データ−平均値)の二乗)の総和÷個数

標準偏差=(分散)のルート