1.2 標準偏差
標準偏差は、グループの全ての値によってバラツキを決めていく。グループの個々の値から算術平均がどれだけ離れているのかによって、バラツキの大きさが決まる。
グループd(1、1、4、7、7)の算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、1-4=-3、4-4=0、7-4=3、7-4=3となる。この算術平均から離れている大きさを平均してやると、バラツキの目安が求められる。しかし、-3、-3、0、3、3を全部足すと0になるため、さらに工夫が必要になる。
例えば、絶対値をとる方法とか値を2乗してマイナスの記号を取る方法がある。2乗した場合、9、9、0、9、9となり、平均値を求めると、5で割って7.2となる。但し、元の単位がcmのときに、2乗すればcm2となるため、7.2を開いて元に戻すと、√7.2 cm2≒2.68 cmというバラツキの大きさになる。
(1) 標準偏差の公式
σ=√Σ (Xi-X)2/n
次にグループe(1、4、4、4、7)について見てみよう。算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、4-4=0、4-4=0、4-4=0、7-4=3となる。この算術平均から離れている大きさを平均すると、バラツキの目安が求められる。しかし、-3、0、0、0、3を全部足すと0になるため、それぞれを2乗して、9、0、0、0、9として平均値を求め、5で割って3. 6を求める。
但し、元の単位がcmのときに2乗すれば、cm2となるため、3. 6を開いて元に戻すと、√3. 6 cm2≒1.89 cmというバラツキの大きさになる。従って、グループdの方がグループeよりもバラつきが大きいことになる。
以下では、標準偏差(1)の公式を使用して、作成した川端康成の「雪国」のデータに関するバラツキから見えてくる特徴を考察していく。
花村嘉英(2018)「川端康成の『雪国』のバラツキについて」より