さて、分散を求める式をもう一度よく見てみると、
分散=((データ−平均値)の2乗)の総和÷個数
この式のなかで2乗になっているので、単位はcmの2乗になります。元々のデータは長さの単位(cm)だったのに、分散の値はその2乗になっているわけです。
そこで、単位をそろえるためには、分散の値の平方根(ルート)をとればいいということになります。分散のルートを標準偏差と呼びます。式では、
標準偏差=(分散)の平方根
となります。
標準偏差のことを英語で、standard deviation といいます。頭文字をとって、SDと表記します。
それでは、データのばらつきを示す数値である、分散と標準偏差をExcelで計算してみましょう。
Excelのシートを開き、C1とD1にそれぞれ、「平均からの差」と「その2乗」と入れます。
C2に平均からの差の式を入れます。
式は「=B2-B$52」です。「=」は式の印。「B2」には長さ3.5がはいっています。「B$52」には平均の式が入っています。「$(ドルマーク)」はおまじないで、次に説明します。
式を入れるとすぐに計算された値が表示されます。ここでは、-1.07142…という値になります。
さて、この式を個数分(49個!)入れなくてはならないとなると、めんどうです。そこでコピー機能を使います。
まず、コピー元であるC2を選択します。
枠の右下の小さな■にマウスカーソルを合わせるとカーソルが十字から四角に変化します。
マウスボタンを押したまま、下にドラッグします。C50のセルまでドラッグしてください。下の図ではC6までドラッグした途中です。
マウスボタンをはなすと、式がコピーされ、すぐに値が表示されます。
確認のため、C6のセルをクリックしてみると、ちゃんと式がコピーされていることがわかります。式はC2のもの(=B2-B$52)が「そのまま」コピーされるのではなく、「B2」が「B6」になっているように、セルに合わせて番号がずれています。しかし、「B$52」は「B$52」のままです。この「$」は「コピーしても番号をずらさない」という印だったのです。
D2に2乗の式を入れます。
式は「C2^2」です。「C2」は平均からの差の値が入っています。「^2」は2乗の意味です。
式を入れるとすぐに値が表示されます。
さきほどの式のコピーと同じようにD2の式を、D50までコピーしてください。
D51に2乗の合計の式を入れます。
式は「=SUM(D2:D50)」です。
D52に2乗の平均の式を入れます。これが分散になります。
式は「=AVERAGE(D2:D50)」です。
D53に2乗の平均のルートの式を入れます。これが標準偏差になります。
式は「=SQRT(D52)」です。「SQRT」はルートの意味です。
それでは次に、モグモグバーガーのポテトの長さの分散を計算しましょう。
◇
Excelで計算しましょう
◇
さて、あなたの計算結果はどうなったでしょうか。
私の計算では次のようになりました。小数点以下第3位で四捨五入してあります。
ワクワクバーガーのポテトの長さの分散は 0.68、標準偏差は 0.83
モグモグバーガーのポテトの長さの分散は 2.58、標準偏差は 1.61
となりました。これを見ると、度数分布図でばらつきの大きかったモグモグバーガーのポテトの長さの分散と標準偏差は、ワクワクバーガーのものよりも大きいことがわかります。
つまり、「度数分布図でのばらつきが大きければ、分散と標準偏差も大きくなる」という関係が成り立っていることが確認できます。
それでは、ここまでの内容をまとめてみましょう。
あるデータの集団を代表の値として平均を用いることが多い。
平均=データの総和÷個数
平均に違いがなくても、データのちらばり具合は異なることがある。
データのちらばり具合を見るためには、度数分布図を描く。
データのちらばり具合を示す数値として、分散や標準偏差を用いる。
分散=((データ−平均値)の二乗)の総和÷個数
標準偏差=(分散)のルート