組合せマーカー数の増加と自由度の増加のこと(SNPの場合から一般化)
昨日の記事で、SNP(2カテゴリカルデータ)の場合、個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数は
であることを記した。
また、個の2カテゴリカルデータの独立性を考えるにあたり、
個すべての独立性を説明するために必要な変数の数は、
個のマーカーについての説明をするための変数の総数より1つ増えるだけであることを記した。
では、一般的にカテゴリからなる複数マーカーの場合はどうなるのだろうか?2カテゴリの場合は、
だったわけである。
結論から言うと、マーカーのすべての独立性を説明するための変数の数は、
である。また、
個の
マーカーセットを説明するための変数の総数から、
マーカーすべての独立性を説明するための変数の増分は
である。
2カテゴリの場合(のときは、
、
これを確かめるエクセルはこちら