多重検定を重層的に繰り返したとき(6)Mantel-Haenszelは自由度=層数のカイ自乗統計量の1次元投影量である

この日の記事の問題点は
『統計量P_j=\prod_{i=1}^M p_{ij}を考えたこと』
独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。

以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして使うので、残す。
この留意は以降、『複数の多テストスタディの累積』のシリーズの(6)、2007/10/26まで適用されるべきである。

今、単純のために、2x2分割表検定を2コホートにて行っているものとする。

Aasum
group_{11}n_{11}n_{12}n_{1.}
group_{12}n_{21}n_{22}n_{2.}
sumn_{.1}n_{.2}n

Aasum
group_{21}m_{11}m_{12}m_{1.}
group_{22}m_{21}m_{22}m_{2.}
summ_{.1}m_{.2}m
コホートごとに、カイ自乗統計量が算出できる。今、分割表の期待度数をE(n_{11})のように書き表すとすると、
\chi^2_1=\frac{(n_{11}-E(n_{11}))^2\times n^3 }{n_{1.}n_{2.}n_{.1}n_{.2}
\chi^2_2=\frac{(m_{11}-E(m_{11}))^2\times m^3 }{m_{1.}m_{2.}m_{.1}m_{.2}
一方、MHの統計量は
\chi^2_{MH}=\frac{(\frac{(n_{11}n_{22}-n_{12}n_{21})}{n}+\frac{(m_{11}m_{22}-m_{12}m_{21})}{m})^2}{\frac{n_{1.}n_{2.}n_{.1}n_{.2}}{n^2(n-1)}+\frac{m_{1.}m_{2.}m_{.1}m_{.2}}{m^2(m-1)}}
今、d1_{11}=n_{11}-E(n_{11},d2_{11}=m_{11}-E(m_{11})とすると、n_{11}=E(n_{11})+d1_{11},n_{12}=E(n_{12})+d1_{11},n_{21}=E(n_{21})-d1_{11},n_{22}=E(n_{22})+d1_{11}などと表せることから、E(n_{11})E(n_{22})-E(n_{12})E(n_{21})に注意すれば
\chi^2_{MH}==\frac{(d1_{11}+d2_{11})^2}{\frac{n_{1.}n_{2.}n_{.1}n_{.2}}{n^2(n-1)}+\frac{m_{1.}m_{2.}m_{.1}m_{.2}}{m^2(m-1)}}
と変形できる。
この式からわかるとおり、\chi^2_{MH}は、d1_{11}+d2_{11}が同一なテーブルにおいて、同一な値をとる。
今、\chi^2_{MH}は、補正項による、多少の誤差はあるが、\chi^2_{MH} \le \chi^2_1+\chi^2_2なる関係にある(掲載図は、ランダムな2x2分割表のペアについての\chi^2_{MH}\chi^2_1+\chi^2_2とのコプロットである。大小関係が見て取れる)。
また、こちらの図は、縦軸にd1_{11}、横軸にd2_{11}をとり、\chi^2_{MH}の値で等高線プロットをしたものである。d1_{11}+d2_{11}が等しいテーブルには、同一の\chi^2_{MH}値が対応していることがわかる。このように、2次元の図であるが、1次元への写像としての性質を持つことから、Mantel-Haenszelの統計量は自由度1でp値を得ることができる。

同様に\chi^2_1+\chi^2_2をプロットしたのが、こちらの図であり、こちらは、2次元の分布を撮っていることがわかる。

これらの具合を試してみるために雑に作ったエクセルは、こちらこちら