組合せマーカー数の増加と自由度の増加のこと(SNPの場合)



SNP(2カテゴリカルデータ)の場合、n個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数は2^n-1である。一方、n個のマーカーを考えるとき、n-1個のマーカーの組合せはn通りあるが、n通りのn-1マーカー組合せの独立性を説明するために必要な変数の数は、2^n-2である。等しくn個の2カテゴリカルデータの独立性を考えるにあたり、n個すべての独立性を説明するために必要な変数の数は、n-1個のマーカーについての説明をするための変数の総数より1つ増えるだけであることがわかる。

このことは次のようにして確かめることができる。

今、k;k=2,3,...n-1個のマーカーのすべての独立性を説明するための変数の数をf(k)とする。また、n個のマーカーが作る、n個のn-1個マーカーセットの独立性を説明する変数の総数から、n個のマーカーのすべての独立を説明する変数の数への増分をg(n)とする。

今、n個のマーカーは、n個の個別マーカーを持ち、_nC_2個のマーカーペアを持ち、_nC_3個のマーカートリオを持ち、、、_nC_{n-1}個のn-1マーカーセットを持つので、f(n)=g(n)+¥sum_{i=1}^{n-1} (_nC_i  g(i))

f(1)=1,g(1)=1は定義から与えられる。

f(n)=2^n-1であることと、2^n=(1+1)^n = ¥sum_{i=0}^{n} (_nC_i) であることに注意するとg(n)=1が得られる。

これは

  • n個すべての独立性を説明するために必要な変数の数は、n-1個のマーカーについての説明をするための変数の総数より1つ増えるだけであることを示している。