ブログ

  • 森鴎外の「山椒大夫」でカイ二乗検定を考える1

    1 カイ二乗検定とは

     カイ二乗検定とは、カテゴリーデータを対象とし、期待値に対し実測値の編りを調べるために使用する検定方法である。実測値は、森鴎外の「山椒大夫」の一場面より作成した。期待値は、そこから一つ一つ計算している。 

    表1
    そこでまた落ち葉の上にすわって、山でさえこんなに寒い、浜辺に行った姉さまは、さぞ潮風が寒かろうと、ひとり涙をこぼしていた。

    日がよほど昇ってから、柴を背負って麓へ降りる、ほかの樵(きこり)が通りかかって、「お前も大夫のところの奴か、柴は日に何荷苅るのか」と問うた。

    「日に三荷苅るはずの柴を、まだ少しも苅りませぬ」と厨子王は正直に言った。

    「日に三荷の柴ならば、午(ひる)までに二荷苅るがいい。柴はこうして苅るものじゃ」樵は我が荷をおろして置いて、すぐに一荷苅ってくれた。

    厨子王は気を取り直して、ようよう午までに一荷苅り、午からまた一荷苅った。 

    花村嘉英(2021)「森鴎外の『山椒大夫』でカイ二乗検定を考える」より

  • 森鴎外の「山椒大夫」でオッズ比を考える5

    3 まとめ

     森鴎外の「山椒大夫」で安寿の読みと厨子王の読みで誘発に関しクロス集計表を作成し、行要素と列要素の関連を計算した。オッズ比で事象の起こりやすさを計算し、統計データから得られた数字の意味を考えた。 オッズ比にまつわる分析に関心がある人は、試してもらいたい。

    参考文献

    中村好一 基礎から学ぶ楽しい保険統計 医学書院 2016
    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
    花村嘉英 三浦綾子の「道ありき」で執筆脳を考える ブログ「シナジーのメタファー」2020
    オッズ比 Wikipedia 

  • 森鴎外の「山椒大夫」でオッズ比を考える4

    表2に数字を(1)を公式に当てはめてオッズ比を計算する。 

    表3
    安寿 誘発あり1 誘発なし4 縦計5
    厨子王 誘発あり4 誘発なし1 縦計5
    誘発あり 安寿1 厨子王4 横計5
    誘発なし 安寿4 厨子王1 横計5

    要因Aありのオッズ=1/4=0.25
    要因Aなしのオッズ=4/1=4
    オッズ比=0.25÷4=0.06 オッズ比は、0.06ということになる。  

    花村嘉英(2021)「森鴎外の『山椒大夫』でオッズ比を考える」より

  • 森鴎外の「山椒大夫」でオッズ比を考える3

    2 森鴎外の「山椒大夫」でクロス集計表を分析する

    表2
    そこでまた落ち葉の上にすわって、山でさえこんなに寒い、浜辺に行った姉さまは、さぞ潮風が寒かろうと、ひとり涙をこぼしていた。安寿誘発1 厨子王誘発1

    日がよほど昇ってから、柴を背負って麓へ降りる、ほかの樵(きこり)が通りかかって、「お前も大夫のところの奴か、柴は日に何荷苅るのか」と問うた。安寿誘発2 厨子王誘発1

    「日に三荷苅るはずの柴を、まだ少しも苅りませぬ」と厨子王は正直に言った。安寿誘発2 厨子王誘発1

    「日に三荷の柴ならば、午(ひる)までに二荷苅るがいい。柴はこうして苅るものじゃ」樵は我が荷をおろして置いて、すぐに一荷苅ってくれた。安寿誘発2 厨子王誘発1

    厨子王は気を取り直して、ようよう午までに一荷苅り、午からまた一荷苅った。 
    安寿誘発2 厨子王誘発2

     指数のため、安寿は、誘発あり1なし4、厨子王は、誘発あり4なし1になる。

    花村嘉英(2021)「森鴎外の『山椒大夫』でオッズ比を考える」より

  • 森鴎外の「山椒大夫」でオッズ比を考える2

     オッズ比が1とは、対象とする事象の起こりやすさが両群で同じということであり、1より大きいとは、事象が第1群(第2群)でより起こりやすいということである。オッズ比は必ず0以上である。第1群(第2群)のオッズが0に近づけばオッズ比は0(∞)に近づく。但し、bやcが0の場合、オッズ比の公式の分母に0が入るため、オッズ比が無限大(∞)になり95%信頼区間もできなくなる。
     そこで4つのセルに0.5を加えて、(a+0.5)x(d+0.5)/ (b+0.5)x(c+0.5)をオッズ比とする。これは、ウォルフ-ハルディンの補正と呼ばれている。

    花村嘉英(2021)「森鴎外の『山椒大夫』でオッズ比を考える」より

  • 森鴎外の「山椒大夫」でオッズ比を考える1

    1 オッズ比とは

     ある事象の起こりやすさを二つの群で比較する統計の尺度である。オッズ比の考え方は、2×2分割表であり、a/bが要因Aあり群の要因Bのオッズ、c/dが要因Aなし群の要因Bのオッズで、両者の比(a/b)/(c/d)=ad/ bcがオッズ比である。

    表1
    要因Aあり 要因Bありa 要因Bなしb 縦計a+b
    要因Aなし 要因Bありc 要因Bなしd 縦計c+d
    横計    a+c     b+d

    n=a+b+c+d
    要因Aありのオッズ=a/b
    要因Aなしのオッズ=c/d
    オッズ比=(a/b)/(c/d)=ad/bc

    花村嘉英(2021)「森鴎外の『山椒大夫』でオッズ比を考える」より

  • 森鴎外の「山椒大夫」でファイ係数を考える5

    3 まとめ  

     森鴎外の「山椒大夫」の虚無ありの読みと虚無なしの読みで結核に関しクロス集計表を作成し、行要素と列要素の関連の強さを計算した。ファイ係数から感度や特異度そして正確度や適合度も計算し、統計データから得られた数字の意味を考えた。ファイ係数の分析に関心がある人は、試してもらいたい。 

    参考文献

    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
    https://best-biostatistics.com/design/kouraku2.html(いちばんやさしい医療統計)
    https://ash-d.click/2018/01/08/st_0108/(性別と購入の関連性)
    https://www.cresco.co.jp/blog/entry/5987/(感度とか特異度)

  • 森鴎外の「山椒大夫」でファイ係数を考える4

     さらに表4の数字を公式(1)に当てはめてファイ係数を計算する。

    安寿 誘発1 行動4 縦計5
    厨子王 誘発2 行動3 縦計5
    誘発 安寿1 厨子王3 横計4
    行動 安寿4 厨子王3 横計7

    (2)1 x 3 – 4 x 2 / √3 x 7 x 5 x 5 = 0.22

     ファイ係数、即ち、行要素と列要素の関連の強さは、弱い関連があるになる。次に、その他の関連する数字を見てみよう。 

    感度= a ÷ (a + c)のため、1÷ (1+2)=0.33。結核ありの真性の割合である。 
    特異度 = d ÷ (b+ d) のため、3 ÷ (4+3)=0.43。結核なしの真性の割合である。
    正確度=(a + d)÷(a +b+ c + d) のため、(1+3 )÷ (1 +4+2+ 3) =0.4。全体の真性の割合である。
    適合度= a÷(a +b) のため、1÷ (1+4)=0.2。虚無ありと判定したものが正解である割合である。

    花村嘉英(2021)「森鴎外の『山椒大夫』でファイ係数を考える」より

  • 森鴎外の「山椒大夫」でファイ係数を考える3

    2 森鴎外の「山椒大夫」でクロス集計表を分析する

    表3
    そこでまた落ち葉の上にすわって、山でさえこんなに寒い、浜辺に行った姉さまは、さぞ潮風が寒かろうと、ひとり涙をこぼしていた。安寿誘発/行動1 厨子王誘発/行動1

    日がよほど昇ってから、柴を背負って麓へ降りる、ほかの樵(きこり)が通りかかって、「お前も大夫のところの奴か、柴は日に何荷苅るのか」と問うた。安寿誘発/行動2 厨子王誘発/行動2

    「日に三荷苅るはずの柴を、まだ少しも苅りませぬ」と厨子王は正直に言った。
    安寿誘発/行動2 厨子王誘発/行動2

    「日に三荷の柴ならば、午(ひる)までに二荷苅るがいい。柴はこうして苅るものじゃ」樵は我が荷をおろして置いて、すぐに一荷苅ってくれた。安寿誘発/行動1 厨子王誘発/行動2

    厨子王は気を取り直して、ようよう午までに一荷苅り、午からまた一荷苅った。
    安寿誘発/行動1 厨子王誘発/行動1

    連関を見るため、表3の数字を加算する。

    花村嘉英(2021)「森鴎外の『山椒大夫』でファイ係数を考える」より

  • 森鴎外の「山椒大夫」でファイ係数を考える2

     その他の関連する数字として、感度や特異度そして正確度や適合度がある。
    感度とは、ある対象に与えた刺激とそれに対する応答の関係に関わる指標である。 感度 = a ÷ (a + c)で計算できる。問題があることを見逃さない割合ともいえる。
     特異度とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。特異度 = d ÷ (b+ d)で計算できる。問題のないことをむやみに疑わないことを表す指標である。
     正確度とは、全体の正解率であり、(a + d)÷(a +b+ c + d) で計算できる。正答の数を全体の数で割る。
     適合度とは、問題ありとなったとき、それがどれだけ実際に問題があるのかを表す指標である。適合度 = a÷(a +b) で計算できる。

    花村嘉英(2021)「森鴎外の『山椒大夫』でファイ係数を考える」より