独立変数同士の関係

1つの2値従属変数について、2つの2値独立変数との独立性を検定する場合を考える。
2つの独立変数について、個々のサンプルは{0,0},{0,1},{1,0},{1,1}の4通りの値セットを持つ。
今、この4値セットの間の関係を考える。Pearsonの相関係数も算出できるが、ここでは、この4値セットを2SNPが作るハプロタイプであるとみなすと、2個の独立変数間の関係は、2SNP間の連鎖不平衡の程度としても捉えることが出来る。
2独立変数の関係が、r^2=1で表される関係のとき、従属変数と、独立変数の間に得られる統計量は、常に一致する。{{0,0},{0,1},{1,0},{1,1}}={n,m,m,n}というような関係にあるときは、r^2の値の多寡が、2つの独立変数に得られる統計量と相関があることは、比較的よく知られていることである。
では、D'=1で表される関係の場合はどうであろうか?これは、{{0,0},{0,1},{1,0},{1,1}}={n1,n2,0,n3}のように表される場合である。このようなとき、第1の独立変数について、{n1+n2,n3} のように集計され、第2の独立変数については、{n1,n2+n3}のように集計される。
ここで、少し目先を変えよう。
SNPについての、ジェノタイプ観測では2x3テーブルが観測される。3ジェノタイプの観測度数を{g1,g2,g3}とする。これを、優性・劣性の遺伝モデルで検定するときには、{g1+g2,g3},{g1,g2+g3}のように集計する。これは、上で述べた、D'=1の関係にある2変数について、それぞれ個別に検定する様式に一致する。
あるSNPについて優性・劣性の2モデルで検定するとき、その2モデルは、互いに、異なる検定であって、そこから算出される統計量は、片方が大きいとき、もう片方は小さく、その逆の場合も成り立つような関係であるのだが、要するにこれは、検定統計量が正の相関を示すのとは逆であることである。

したがって、ある2独立変数(2値)について、その2つの関係を試みにr^2,D'にて評価すると、その2変数から得られる検定結果は、片や、相互に似通った値をもたらすことについての指標である、片や、相互に異なる値をもたらすことについての指標となりうることが分かる。
相互に似通った値をもたらすような独立変数をたくさん用いるとき、それらに対する多仮説検定補正は、相互に相反する値をもたらすような独立変数についての多仮説検定補正とは、逆方向であることも、類推される。

今、LDインデックスを用いたが、LDインデックスは、アレル頻度によらずに求められる数値であるが、統計量間の関係の評価にあたっては、LDインデックスで得られる関係にアレル頻度的情報量を加えた関係によってより正確に評価できることも予想される。