CNV検定(2)

この記事はこちらの記事の続き。
今、コピー数アレルNAがある。
ディプロタイプが確定できるとき、ジェノタイプはNGx=\frac{NA(NA+1)}{2}。ディプロタイプが確定できず、保有コピー数が確定できるとき、ジェノタイプはNGy=NA+1

ケース・コントロールの2群で、このジェノタイプ分布に差があるかどうかに興味があるので、差がないという帰無仮説について棄却検定をする。

今、ジェノタイプのそれぞれが相互に独立であると考えるときには、2\times NGxテーブルについてカイ自乗検定を行うことが可能で、自由度はNGx-1(ただし、分割表の周辺度数について見たとき、NGx種類のすべてのジェノタイプが1以上であるとする)。同様にコピー数のジェノタイプの場合にも、自由度NGy-1のカイ自乗検定ができる。

先行論文において、いくつかの検定法が示されている。
そのひとつは、保有コピー数について、ある閾値より多いか少ないかで2分し、2x2分割表に直した上で、自由度1のカイ自乗検定を行う方法である(便宜上、2分法と呼ぶことにする)。
別法は、Mann-Whiteneyを用いて、コピー数にランクをつけて検定する方法である。MWW法と呼んでおくことにする。これは、順位の並びから得られる統計量が標準正規分布に近似できることで行う検定であり、CNV分割表のようにコピー数という一次元順序を取り込む場合には、自由度としては1である。

この3法(カイ自乗heterogeneityテスト、2分法、MWW法)がシミュレーションデータにてどのような相関関係にあるかを以下のプロットで示す。
3法はそれぞれ、比較していることが異なるので、一致するものではないが、NAが小さいときには、ある程度の相関を残すことも読み取れる。


図のファイル