多重検定を重層的に繰り返したとき(6)Mantel-Haenszelは自由度=層数のカイ自乗統計量の1次元投影量である
この日の記事の問題点は
『統計量を考えたこと』
独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。
以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして使うので、残す。
この留意は以降、『複数の多テストスタディの累積』のシリーズの(6)、2007/10/26まで適用されるべきである。
今、単純のために、2x2分割表検定を2コホートにて行っているものとする。
A | a | sum | |
---|---|---|---|
sum |
A | a | sum | |
---|---|---|---|
sum |
一方、MHの統計量は
今、,とすると、などと表せることから、に注意すれば
と変形できる。
この式からわかるとおり、は、が同一なテーブルにおいて、同一な値をとる。
今、は、補正項による、多少の誤差はあるが、なる関係にある(掲載図は、ランダムな2x2分割表のペアについてのととのコプロットである。大小関係が見て取れる)。
また、こちらの図は、縦軸に、横軸にをとり、の値で等高線プロットをしたものである。が等しいテーブルには、同一の値が対応していることがわかる。このように、2次元の図であるが、1次元への写像としての性質を持つことから、Mantel-Haenszelの統計量は自由度1でp値を得ることができる。
同様にをプロットしたのが、こちらの図であり、こちらは、2次元の分布を撮っていることがわかる。
これらの具合を試してみるために雑に作ったエクセルは、こちらとこちら。