川端康成の「雪国」のバラツキについて2


1.2 標準偏差

 標準偏差は、グループの全ての値によってバラツキを決めていく。グループの個々の値から算術平均がどれだけ離れているのかによって、バラツキの大きさが決まる。
 グループd(1、1、4、7、7)の算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、1-4=-3、4-4=0、7-4=3、7-4=3となる。この算術平均から離れている大きさを平均してやると、バラツキの目安が求められる。しかし、-3、-3、0、3、3を全部足すと0になるため、さらに工夫が必要になる。
 例えば、絶対値をとる方法とか値を2乗してマイナスの記号を取る方法がある。2乗した場合、9、9、0、9、9となり、平均値を求めると、5で割って7.2となる。但し、元の単位がcmのときに、2乗すればcm2となるため、7.2を開いて元に戻すと、√7.2 cm2≒2.68 cmというバラツキの大きさになる。
 
(1) 標準偏差の公式
σ=√Σ (Xi-X)2/n

 次にグループe(1、4、4、4、7)について見てみよう。算術平均は4である。それぞれの値から算術平均を引くと、1-4=-3、4-4=0、4-4=0、4-4=0、7-4=3となる。この算術平均から離れている大きさを平均すると、バラツキの目安が求められる。しかし、-3、0、0、0、3を全部足すと0になるため、それぞれを2乗して、9、0、0、0、9として平均値を求め、5で割って3. 6を求める。
 但し、元の単位がcmのときに2乗すれば、cm2となるため、3. 6を開いて元に戻すと、√3. 6 cm2≒1.89 cmというバラツキの大きさになる。従って、グループdの方がグループeよりもバラつきが大きいことになる。
以下では、標準偏差(1)の公式を使用して、作成した川端康成の「雪国」のデータに関するバラツキから見えてくる特徴を考察していく。 

花村嘉英(2018)「川端康成の『雪国』のバラツキについて」より


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です