SNP2x3データ分割表検定(漸近近似)まとめ



2x3分割表が得られたとする。

XXXxxx合算
ケースabcg
コントロールdefh
合計ijkn

検定方法として漸近近似による方法として次のようなものがある。

カイ自乗検定では、

2x3分割表についてのそれ(¥chi^2_{2x3})

アレルについて2x2分割表を作り直して

Xx合算
ケース2a+bb+2c2g
コントロール2d+ee+2f2h
合計2i+jj+2k2n

これから、¥chi^2_{2x2allele}

優性遺伝形式と考えて作る2x2分割表

Xx合算
ケースa+bcg
コントロールd+efh
合計i+jkn

これから、¥chi^2_{2x2dom}

劣性遺伝形式と考えて作る2x2分割表

Xx合算
ケースac+bg
コントロールdf+eh
合計ik+jn

これから、¥chi^2_{2x2dom}

トレンドテストの枠組みでそれぞれアレルについて、優性遺伝形式について、劣性遺伝形式について考える場合には

XXXxxx合算
ケースabcg
コントロールdefh
合計ijkn
重みアレルw1w1+zw1+2z
重み優性w2+z2w2+z2w2
重み劣性w3+z3w3w3

ただし、w*,z*はいずれも正の数

これから、アレル・優性・劣性のそれぞれについて、3種類の統計量が出る。それは、¥chi^2_{heterogeneity},¥chi^2_{trend},¥chi^2_{deviation from model}

これらを、

¥chi^2_{het,allele},¥chi^2_{tr,allele},¥chi^2_{dev,allele}

¥chi^2_{het,dom},¥chi^2_{tr,dom},¥chi^2_{dev,dom}

¥chi^2_{het,rec},¥chi^2_{tr,rec},¥chi^2_{dev,rec}

と書くこととする。分割表から得られた統計量4個と併せ、全部で13個の統計量があることがわかる。これらの関係を含め、いくつかの性質を以下に示す。

  • トレンドテストの重み付け係数についてであるが、w*,z*については、値の大小を変えても¥chi^2_{het,allele},¥chi^2_{tr,allele},¥chi^2_{dev,allele}

¥chi^2_{het,dom},¥chi^2_{tr,dom},¥chi^2_{dev,dom}

¥chi^2_{het,rec},¥chi^2_{tr,rec},¥chi^2_{dev,rec}は変わらない

  • ¥chi^2_{het,allele}=¥chi^2_{het,dom}=¥chi^2_{het,rec}
  • さらに、これは¥chi^2_{2x3}とも同一
    • ¥chi^2_{2x3}=¥chi^2_{het,*}
  • 優性・劣性の場合は、2x2分割表カイ自乗値とトレンドの統計量があい等しい
    • ¥chi^2_{2x2dom}=¥chi^2_{tr,dom}
    • ¥chi^2_{2x2rec}=¥chi^2_{tr,rec}
  • アレルの場合は、2x2分割表の場合とトレンドとで異なる。
    • ¥chi^2_{2x2allele} ¥ne ¥chi^2_{tr,allele}
  • トレンドテストの場合には、¥chi^2_{het,*}(均一性についての検定)も出て、これについてもP値化される。P値が1のときには、モデルに完全にフィットしたことを示し、0に近いときは、モデルへの当てはまりが悪いことを示す。

これらについてのエクセルはこちら