ブログ

  • 森鴎外の「佐橋甚五郎」でカイ二乗検定を考える1

    1 カイ二乗検定とは

     カイ二乗検定とは、カテゴリーデータを対象とし、期待値に対し実測値の編りを調べるために使用する検定方法である。実測値は、森鴎外の「佐橋甚五郎」の一場面より作成した。期待値は、そこから一つ一つ計算している。 

    2 森鴎外の「佐橋甚五郎」でクロス集計表を分析する

    表1
    源太夫はこういう話をした。甚五郎は鷺を撃つとき蜂谷と賭をした。蜂谷は身につけているものを何なりとも賭けようと言った。甚五郎は運よく鷺を撃ったので、ふだん望みをかけていた蜂谷の大小をもらおうと言った。

    それもただもらうのではない。代わりに自分の大小をやろうというのである。しかし蜂谷は、この金熨斗付きの大小は蜂谷家で由緒のある品だからやらぬと言った。

    甚五郎はきかなんだ。「武士は誓言をしたからは、一命をもすてる。よしや由緒があろうとも、おぬしの身に着けている物の中で、わしが望むのは大小ばかりじゃ。ぜひくれい」と言った。

    「いや、そうはならぬ。命ならいかにも棄ちょう。家の重宝は命にも換えられぬ」と蜂谷は言った。「誓言を反古(ほご)にする犬侍め」と甚五郎がののしると、蜂谷は怒って刀を抜こうとした。

    甚五郎は当身を食わせた。それきり蜂谷は息を吹き返さなかった。平生何事か言い出すとあとへ引かぬ甚五郎は、とうとう蜂谷の大小を取って、自分の大小を代りに残して立ち退いたというのである。

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』でカイ二乗検定を考える」より

  • 森鴎外の「佐橋甚五郎」でファイ係数を考える4

    3 まとめ  

     森鴎外の「佐橋甚五郎」の虚無ありの読みと虚無なしの読みで結核に関しクロス集計表を作成し、行要素と列要素の関連の強さを計算した。ファイ係数から感度や特異度そして正確度や適合度も計算し、統計データから得られた数字の意味を考えた。ファイ係数の分析に関心がある人は、試してもらいたい。 

    参考文献

    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
    https://best-biostatistics.com/design/kouraku2.html(いちばんやさしい医療統計)
    https://ash-d.click/2018/01/08/st_0108/(性別と購入の関連性)
    https://www.cresco.co.jp/blog/entry/5987/(感度とか特異度)

  • 森鴎外の「佐橋甚五郎」でファイ係数を考える3

    さらに表4の数字を公式(1)に当てはめてファイ係数を計算する。

    表4
    甚五郎 創発2 行動3 縦計5
    源太夫 創発1 行動4 縦計5
    創発 甚五郎2 源太夫1 横計5
    行動 甚五郎3 源太夫4 横計7

    (2)2 x 4 -3 x 1 / √3 x 7 x 5 x 5 = 0.22

     ファイ係数、即ち、行要素と列要素の関連の強さは、弱い関連があるになる。次に、その他の関連する数字を見てみよう。 

    感度= a ÷ (a + c)のため、2÷ (2+1)=0.5。結核ありの真性の割合である。 
    特異度 = d ÷ (b+ d) のため、4 ÷ (3+4)=0.57。結核なしの真性の割合である。
    正確度=(a + d)÷(a +b+ c + d) のため、(2+4 )÷ (4 +3+1+ 4) =0.5。全体の真性の割合である。
    適合度= a÷(a +b) のため、2÷ (2+3)=0.4。虚無ありと判定したものが正解である割合である。

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』でファイ係数を考える」より

  • 森鴎外の「佐橋甚五郎」でファイ係数を考える2

    2 森鴎外の「佐橋甚五郎」でクロス集計表を分析する

    表3
    源太夫はこういう話をした。甚五郎は鷺を撃つとき蜂谷と賭をした。蜂谷は身につけているものを何なりとも賭けようと言った。甚五郎は運よく鷺を撃ったので、ふだん望みをかけていた蜂谷の大小をもらおうと言った。
    甚五郎創発/行動2 源太夫創発/行動2

    それもただもらうのではない。代わりに自分の大小をやろうというのである。しかし蜂谷は、この金熨斗付きの大小は蜂谷家で由緒のある品だからやらぬと言った。甚五郎創発/行動2 源太夫創発/行動2

    甚五郎はきかなんだ。「武士は誓言をしたからは、一命をもすてる。よしや由緒があろうとも、おぬしの身に着けている物の中で、わしが望むのは大小ばかりじゃ。ぜひくれい」と言った。
    甚五郎創発/行動2 源太夫創発/行動2

    「いや、そうはならぬ。命ならいかにも棄ちょう。家の重宝は命にも換えられぬ」と蜂谷は言った。「誓言を反古(ほご)にする犬侍め」と甚五郎がののしると、蜂谷は怒って刀を抜こうとした。
    甚五郎創発/行動1 源太夫創発/行動1

    甚五郎は当身を食わせた。それきり蜂谷は息を吹き返さなかった。平生何事か言い出すとあとへ引かぬ甚五郎は、とうとう蜂谷の大小を取って、自分の大小を代りに残して立ち退いたというのである。
    甚五郎創発/行動1 源太夫創発/行動1

    連関を見るため、表3の数字を加算する。

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』でファイ係数を考える」より

  • 森鴎外の「佐橋甚五郎」でファイ係数を考える1

    1 ファイ係数

    ファイ係数は、2行x2行のクロス集計表における行要素と列要素の関連の強さを示す指標である。例えば、

    表1
    喫煙 肺がんありA 肺がんなしB 計N1
    非喫煙 肺がんありC 肺がんなしD 計N2
    肺がんあり 喫煙A 非喫煙C 計M1
    肺がんなし 喫煙B 非喫煙D 計M2

    ファイ係数は、次の式で求められる。絶対値が大きいほど関連が強い。 
    (1)φ = A x D –B x C /√M1 x M2 x N1 x N2

    表2
    係数(絶対値)  評価
    ~0.2      殆ど関連なし。
    0.2~0.4      弱い関連あり。
    0.4~0.7 中程度の関連あり。
    0.7~1 強い関連あり。

     その他の関連する数字として、感度や特異度そして正確度や適合度がある。
    感度とは、ある対象に与えた刺激とそれに対する応答の関係に関わる指標である。 感度 = a ÷ (a + c)で計算できる。問題があることを見逃さない割合ともいえる。
     特異度とは、臨床検査の性格を決める指標の1つで、ある検査について「陰性のものを正しく陰性と判定する確率」として定義される値である。特異度 = d ÷ (b+ d)で計算できる。問題のないことをむやみに疑わないことを表す指標である。
     正確度とは、全体の正解率であり、(a + d)÷(a +b+ c + d) で計算できる。正答の数を全体の数で割る。
     適合度とは、問題ありとなったとき、それがどれだけ実際に問題があるのかを表す指標である。適合度 = a÷(a +b) で計算できる。

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』でファイ係数を考える」より

  • 森鴎外の「佐橋甚五郎」で交絡を考える3

    3 まとめ  

     周知のように、満たされない欲求は、不満、怒り、不快感につながる。そのため、森鴎外の「佐橋甚五郎」のデータベースを分析する場合、情動に関連するデータを制御しながら分析レポートを作成すると面白い。交絡の分析に関心がある人は、試してもらいたい。 

    参考文献

    中村好一 基礎から学ぶ楽しい保険統計 医学書院 2016
    高城和義 パーソンズ 医療社会学の構想 岩波書店 2002
    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
    花村嘉英 从认知语言学的角度浅析鲁迅作品-魯迅をシナジーで読む 華東理工大学出版社2015
    花村嘉英 日语教育计划书-面向中国人的日语教学法与森鸥外小说的数据库应用 日本語教育のためのプログラム-中国語話者向けの教授法から森鴎外のデータベースまで 南京東南大学出版社 2017
    花村嘉英 从认知语言学的角度浅析纳丁・戈迪默 ナディン・ゴーディマと意欲 華東理工大学出版社 2018
    花村嘉英 シナジーのメタファーの作り方-トーマス・マン、魯迅、森鴎外、ナディン・ゴーディマ、井上靖 中国日语教学研究会上海分会論文集 2018
    花村嘉英 川端康成の「雪国」から見えてくるシナジーのメタファーとは-「無と創造」から「目的達成型の認知発達」へ 中国日语教学研究会上海分会論文集 2019
    花村嘉英 社会学の観点からマクロの文学を考察する-危機管理者としての作家について 中国日语教学研究会上海分会論文集 2020
    森鴎外:山椒大夫・高瀬舟・安部一族 角川文庫 1995
    https://best-biostatistics.com/design/kouraku2.html(いちばんやさしい医療統計 交絡因子とは?)

  • 森鴎外の「佐橋甚五郎」で交絡を考える2

    2 実例 

     森鴎外の執筆時の脳の活動を感情として、「森鴎外と感情」というシナジーのメタファーを考えたことがある。感情の下に情動と畏敬があり、情動の下に創発と誘発がある。「山椒大夫」と「佐橋甚五郎」の違いは、前者が誘発の強い情動(外から内)で、後者が創発の強い情動(内から外)というところにある。感情と対になる概念は行動である。  
     武芸に優れ遊芸も巧者であった佐橋甚五郎は、欲求が満たされず怒りの情動が攻撃的な行動を促す。蜂谷との賭けであれ、小山城攻めの軍功であれそうである。思いが満たされないため、不快感が生じて情動が現れている。ここでは、満たされない欲求が原因で結果を攻撃的な行動にする。金品は、原因結果の一例になる。一方、情動はどうであろうか。隠れた因子として交絡因子になりうるであろうか。
      
    1 ある時、信康の物詣の際に、通りすがりの沼に下りていた鷺を撃てるかどうかで小姓の蜂谷と口論になった。そこで何かを賭けることにした。鉄砲の銃弾は運良く鷺に命中した。甚五郎は、蜂谷に金熨斗付きの大小を求めた。しかし、蜂谷は拒んだ。翌日、蜂谷は傷もないのに死んでいた。甚五郎の行方がわからない。武士の意地を内から外への思考とすると、脳の活動としては創発が考えられる。甚五郎の欲求は、蜂谷が拒絶したために満たされない。欲求の充足は阻止された。そこで怒りが生じ情動が生まれる。こうした創発は、人に攻撃的な行動を促すため、1は成立する。 
    2 家康は事情を察してから源太夫に言い放つ。奉公として甚五郎に武田方の甘利四郎三郎を討たせることになった。甚五郎は、目の上の瘤であった小山の城で甘利を討ち、さらには北條氏に対陣を張って軍功を収めた。ところが甚五郎に賞美の言葉はなかった。その上、甘利に可愛がられていたとのことで、大阪へ遷った羽柴家への使いを見送られる。その後、源太夫の邸へも立ち寄らずに行方がわからなくなった。不快感が生じて情動が現れているため、2は成立である。 
    3 24年の月日を経て朝鮮からの使いとして朝鮮人になりすまして甚五郎は家康の前に現れる。不快感があればあるほど、情動が働いて、攻撃的な行動になる。然りである。武士の意地が働いて、気持ちが高揚している。従って、情動は中間因子になる。3は成立である。1から3の全てが成立するため、情動は、交絡因子になりえる。  

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』で交絡を考える」より

  • 森鴎外の「佐橋甚五郎」で交絡を考える1

    1 交絡因子

     観察する2つの因子と相互に関連していて、これらの因子間の観察結果に影響を及ぼす第3の因子のことを交絡因子(confounding factor, confounder)という。ある因子が交絡因子になるためには、以下の3つの条件が必要である。

    1 アウトカムに影響を与える。交絡因子➩アウトカム
    2 要因との関連がある。交絡因子⇔要因
    3 要因とアウトカムの中間因子ではない。要因×➩中間因子×➩アウトカム

     以上の3つが揃っていれば、因子は交絡因子になる。なお、交絡、交絡因子、交絡バイアスという用語を確認しておく。

    花村嘉英(2021)「森鴎外の『佐橋甚五郎』で交絡を考える」より

  • 森鴎外の「山椒大夫」でカイ二乗検定を考える3

    3 まとめ

     森鴎外の「山椒大夫」で自覚症状と検査に関しクロス集計表を作成し、行要素と列要素の関連を計算し、カイ二乗値を計算し数字の意味を考えた。カイ二乗検定にまつわる分析に関心がある人には、是非試してもらいたい。カイ二乗検定の分析に関心がある人は、試してもらいたい。 

    参考文献

    中村好一 基礎から学ぶ楽しい保険統計 医学書院 2016
    花村嘉英 計算文学入門-Thomas Mannのイロニーはファジィ推論といえるのか?   新風舎 2005
    花村嘉英 莫言の「蛙」でカイ二乗検定を考える ファンブログ 2020
    花村嘉英 莫言の「蛙」でファイ係数を考える ファンブログ 2020
    いちばんやさしい、医療統計 カイ二乗検定 best-biostatistics.com

  • 森鴎外の「山椒大夫」でカイ二乗検定を考える2

    カテゴリーとして、自覚症状と検査で治療があるかどうかの件数を考える。

    表2 観測データ

    安寿 誘発3 行動2 縦計5
    厨子王 誘発4 行動1 縦計5
    誘発 安寿3 厨子王4 横計7
    行動 安寿2 厨子王1 横計3

    ① 安寿で創発ありのカテゴリー。10 x 5/10 x 7/10 = 3.5  
    ② 安寿で創発なしのカテゴリー。10 x 5/10 x 3/10 = 1.5
    ③ 厨子王で治療ありのカテゴリー。10 x 5/10 x 7/10 = 3.5  
    ④ 厨子王で治療なしのカテゴリー。10 x 5/10 x 3/10 = 1.5  

    表3 期待度数
    甚五郎 創発あり3.5 創発なし1.5 
    蜂谷 創発あり3.5 創発なし1.5 

    カイ二乗検定は、表2と表3の差を計算する。(観測データ-期待度数)2 / 期待度数の公式で各カテゴリーを計算すると、表4になる。

    表4 差の計算

    自覚 治療あり0.07 治療なし0.17
    検査 治療あり0.07 治療なし0.17

    カイ二乗検定は、表4の値を全て足したものになる。0.07 +0.07+0.17+0.17=0.48
    カイ二乗値、つまり、観測と期待度数の差は、0.48になる。

    花村嘉英(2021)「森鴎外の『山椒大夫』でカイ二乗検定を考える」より