正確生起確率

  • 清書はこちら
  • N\times Mのテーブルがある
  • Pr(ex)=\frac{\prod_{i=1}^N \Gamma(n_{i.}+1) \times \prod_{j=1}^M \Gamma(n_{.j}+1)}{\Gamma(n_{..}+1)\times \prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}は公式
  • 今、このテーブルの独立性の検定のカイ自乗値がcであるとしたとき、自由度k=(N-1)(M-1)で、あり、自由度kのカイ自乗統計量の確率密度の値はPr(\chi^2=c|df=k)=\frac{(\frac{1}{2})^{\frac{k}{2}}}{\Gamma(\frac{k}{2})}c^{\frac{k}{2}-1}e^{-\frac{c}{2}}と表される
  • ここで、Pr(ex)Pr(\chi^2=c|df=k)の比R=Pr(ex)/Pr(\chi^2=c|df=k)を考える
    • 自由度のみに依存する項が出てきたら、どんどん、f_i(k)にまとめて表記を省略し、周辺度数のみに依存する項が出てきたら、同様に、g_j(m)にまとめて省略することとする。
  • Pr(ex)=g_i(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}
  • Pr(\chi^2=c|df=k)=f_1(k)g_2(m)c^{\frac{k}{2}-1}e^{-\frac{c}{2}}
  • R=f_2(k)g_3(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}\times \frac{1}{c^{\frac{k}{2}-1}e^{-\frac{c}{2}}}
  • ここで、尤度比検定から得られる統計量c'=2(\sum_{i,j} n_{ij} ln(\frac{n_{ij}}{n_{..}}-ln(\frac{e_{ij}}{n_{..}}))=2(\sum_{i,j} n_{ij}(ln\frac{n_{ij}}{e_{ij}}))は、分割表から得られるcとほぼ同じであることから
  • R\approx f_2(k)g_3(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}\times \frac{e^{\sum_{i,j} n_{ij}(ln\frac{n_{ij}}{e_{ij}})}}{c'^{\frac{k}{2}-1}}
  • さらにg_i(m)を更新して(ln(e_{ij})=ln(n_{i.}+n_{.j}-n_{..})を利用する)
    • R\approx f_2(k)g_4(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}\times \frac{e^{\sum_{i,j} n_{ij}(ln(n_{ij})}}{c'^{\frac{k}{2}-1}}
  • e^{y ln(y)}=y^yを利用して
  • R\approx f_2(k)g_4(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \Gamma(n_{ij}+1)}\times \frac{\prod_{i}^N\prod_{j}^M n_{ij}^{n_{ij}}}{c'^{\frac{k}{2}-1}}
  • ここで、近似\Gamma(z+1)\approx \sqrt(2\pi z)(\frac{z}{e})^zを使うと
  • R\approx f_2(k)g_4(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \sqrt(2\pi n_{ij})(\frac{n_{ij}}{e})^{n_{ij}}}\times \frac{\prod_{i}^N\prod_{j}^M n_{ij}^{n_{ij}}}{c'^{\frac{k}{2}-1}}
  • R\approx f_2(k)g_5(m)\frac{1}{\prod_{i=1}^N \prod_{j=1}^M \sqrt(2\pi n_{ij})}\times \frac{1}{c'^{\frac{k}{2}-1}}