組合せマーカー数の増加と自由度の増加のこと(SNPの場合から一般化)



昨日の記事で、SNP(2カテゴリカルデータ)の場合、n個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数は2^n-1であることを記した。

また、n個の2カテゴリカルデータの独立性を考えるにあたり、n個すべての独立性を説明するために必要な変数の数は、n-1個のマーカーについての説明をするための変数の総数より1つ増えるだけであることを記した。

では、一般的にaカテゴリからなる複数マーカーの場合はどうなるのだろうか?2カテゴリの場合は、a=2だったわけである。

結論から言うと、nマーカーのすべての独立性を説明するための変数の数は、a^n-1である。また、n個のn-1マーカーセットを説明するための変数の総数から、nマーカーすべての独立性を説明するための変数の増分は(a-1)^nである。

2カテゴリの場合(a=2のときは、a^n-1=2^n-1(a-1)^n=1^n=1

これを確かめるエクセルはこちら