正確生起確率とカイ自乗値

  • こちらの記事の続き
  • P_{ex}は、自由度kの分割表の正確生起確率
  • xはその表のとるカイ自乗値
  • Pr(\chi^2=x|df=x)は、カイ自乗値がxのときの、自由度kのカイ自乗確率密度分布の値
  • S_k(r)は、半径rのk次元球の表面積
  • n_{ij},n_{i.},n_{.j},n_{..}は表のセルの値と周辺度数
  • f_{ij}は、表のセルの値、周辺度数を総観測数で除した値

Pr(\chi^2=x|df=k)\approx \frac{1}{2}S_k(x^{\frac{1}{2}}) x^{-\frac{1}{2}}n_{..}^k\sqrt{\frac{\prod_{i,j}f_{ij}}{\prod_i f_{i.}\prod_j f_{.j}}}\times P_{ex}
\frac{1}{2}S_k(x^{\frac{1}{2}}) x^{-\frac{1}{2}}n_{..}^k
is the term to fit multi-dimensional $\chi^2$ distribution to multi-dimensional (right) sphere.
\sqrt{\frac{\prod_{i,j}f_{ij}}{\prod_i f_{i.}\prod_j f_{.j}}}
is ther term to explain the deviation of the exact probability from right k-sphere due to uneveness of marginal counts, n_{i.} and n_{.j},
and discrete feature of the table.