CNV多型をはじめとする多(3以上)アレルのHWE検定 3

ディプロイドのコピー数多型が染色体別に決定されたとして、観測サンプルのコピー数別アレル数を確定的に算出し、それをもとに期待度数を算出し、観測度数と比較してカイ自乗検定をする場合と、ディプロイドの保有コピー総数のみが観測されて、それに基づいて、EMでコピー数アレル頻度を推定し、それから期待度数を算出し、その値に基づいて、同様にカイ自乗検定を行う場合とで、その検定P値がどのくらい一致するかを、シミュレーションデータで調べてみる。アレルタイプが2つだけのときは、両者は一致するが、アレルタイプ数が増えるにつれ、一致度は下がる。アレルタイプ数3のときの図でもっともよくわかるように、両者の統計量には、片側にある限界を定める関係線が存在する。アレルタイプ数が増えると、その限界線の許容範囲も拡大していることがわかる。


図のファイル