ぱらぱらめくる『Algebraic geometry of 2x2 contingency tables』

  • この本の第3章

Algebraic and Geometric Methods in Statistics

Algebraic and Geometric Methods in Statistics

  • 2x2表は(の頻度)は4セルで\Delta_3なる3次元の正単体(正四面体)に対応づく
  • \Delta_3において、縦横独立という条件はhyperbolic paraboloidの形をとり(オッズ比が1ということだ)
    • そのほかに特定のオッズ比をとるテーブル集合とか、いろいろな測度に関して部分集合をとれば、それは\Delta_3内の多様体になっている
  • 2x2表の4セルをp=(p_{11},p_{12},p_{21},p_{22});\sum p_{ij} =1というベクトルにする
    • \Delta_3全体を表すのは、行列を使って表せば
      • \begin{pmatrix} 1 1 1 1 \end{pmatrix} \begin{pmatrix} p_{11}\\p_{12} \\ p_{21} \\ p_{22} \end{pmatrix} = \begin{pmatrix} 1 \end{pmatrix}
    • p_{11}+p_{12}=s,p_{21}+p_{22}=1-sという条件付きの分割表は
      • \begin{pmatrix} 1 1 0 0\\0 0 1 1 \end{pmatrix} \begin{pmatrix} p_{11}\\p_{12} \\ p_{21} \\ p_{22} \end{pmatrix} = \begin{pmatrix} s \\ 1-s \end{pmatrix}
    • オッズ比の制約(\frac{p_{11}}{p_{12}} = \frac{r_{11}}{r_{12}},\frac{p_{21}}{p_{22}} = \frac{r_{21}}{r_{22}}があるとき
      • \begin{pmatrix} 1 1 1 1 \\ r_{12} -r_{11} 0 0 \\ 0 0 r_{22} -r_{21}\end{pmatrix} \begin{pmatrix} p_{11}\\p_{12} \\ p_{21} \\ p_{22} \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \\ 0\end{pmatrix}
    • 独立モデルは
      • \begin{pmatrix} 1 1 1 1 \end{pmatrix} \begin{pmatrix} p_{11}\\p_{12} \\ p_{21} \\ p_{22} \end{pmatrix} = \begin{pmatrix} 1 \end{pmatrix}
      • \begin{pmatrix} 1 -1 -1 1 \end{pmatrix} \begin{pmatrix} \log (p_{11})\\ \log (p_{12}) \\  \log (p_{21}) \\ \log (p_{22}) \end{pmatrix} = \begin{pmatrix}0 \end{pmatrix}との両方を満足する部分
        • ちなみにp_{11} p_{22} - p_{12} p_{21} =0はこの4つの値でできた2x2表の行列式行列式の値が0であるような多項式制約が作る多様体はDeterminantal variety と言って、扱いやすい多様体であるそうで、またSegre variety はDeterminantal varietyの一つなのだそうだが、ここでも、何かしら、関係しているようだ
    • 分割表が3次以上になってくると、条件付き確率も複雑になってくる。このような高次の表で、部分的な次元の表(2x2表を軸の取り方を変えて)をいくつか観察し、その相互のつじつま合わせをしようとすると、「なんか変(Simpson's paradox)」が起きるが、それは高次分割表を空間配置してやると、個々の表は点だが、個々の部分次元の表(2x2表とか)は点ではなくそれより高次な多様体になっており、部分次元の表の数だけ多様体が錯綜している状態に対応する。そのときに表に対応する真の点ではなく点より高次な多様体から代表点を思い描いていたりすると、「なんか変」と思ってしまうことになる。
  • この本の目次は:
    • Frequently used notations and symbols;
    • Preface;
    • 1. Algebraic and geometric methods in statistics P. Gibilisco, E. Riccomagno, M. P. Rogantin and H. P. Wynn;
    • Part I. Contingency Tables:
      • 2. Maximum likelihood estimation in latent class models S. E. Fienberg, P. Hersh, A. Rinaldo and Y. Zhou;
      • 3. Algebraic geometry of 2 x 2 contingency tables A. Slavkovic and S. E. Fienberg;
      • 4. Model selection for contingency tables with algebraic statistics A. Krampe and S. Kuhnt;
      • 5. Markov chains, quotient ideals, and connectivity Y. Chen, I. Dinwoodie and R. Yoshida;
      • 6. Algebraic category distinguishability E. Carlini and F. Rapallo;
      • 7. Algebraic complexity of MLE for bivariate missing data S. Hoten and S. Sullivant;
      • 8. The generalized shuttle algorithm A. Dobra and S. E. Fienberg;
    • Part II. Designed Experiments:
      • 9. Generalised design H. Maruri-Aguilar and H. P. Wynn;
      • 10. Design of experiments and biochemical network inference R. Laubenbacher and B. Stigler;
      • 11. Replicated measurements and algebraic statistics R. Notari and E. Riccomagno;
      • 12. Indicator function and sudoku designs R. Fontana and M. P. Rogantin;
      • 13. Markov basis for design of experiments and three-level factors S. Aoki and A. Takemura;
    • Part III. Information Geometry:
      • 14. Non-parametric estimation R. F. Streater;
      • 15. Banach manifold of quantum states R. F. Streater;
      • 16. On quantum information manifolds A. Jenov;
      • 17. Axiomatic geometries for text documents G. Lebanon;
      • 18. Exponential manifold by reproducing kernel Hilbert spaces K. Fukumizu;
      • 19. Extended exponential models D. Imparato and B. Trivellato;
      • 20. Quantum statistics and measures of quantum information F. Hansen;
    • Part IV. Information Geometry and Algebraic Statistics:
      • 21. Algebraic varieties vs differentiable manifolds G. Pistone;
    • Part V. On-Line Supplements: Coloured Figures for Chapter 2;
      • 22. Maximum likelihood estimation in latent class models Y. Zhou;
      • 23. The generalized shuttle algorithm A. Dobra and S. E. Fienberg;
      • 24. Indicator function and sudoku designs R. Fontana and M. P. Rogantin;
      • 25. Replicated measurements and algebraic statistics R. Notari and E. Riccomagno;
      • 26. Extended exponential models D. Imparato and B. Trivellato.