6 Heterogeneity test

  • すべてをばらばらに見る独立性検定
  • ジェノタイプに順序を想定することなく、フェノタイプにも順序を想定しない場合に行う検定
  • SNPの場合のヘテロのジェノタイプの疾患リスクがホモのジェノタイプのいずれよりもリスクが高い場合も、ヘテロのリスクがホモのリスクの間である場合も区別せずに、淡々と、ジェノタイプとフェノタイプの間の分布の偏りがあるかないかを検定する。CNPの場合は、あるコピー数和の多寡とリスクの多寡の順序が一致する必要なく、淡々と、ジェノタイプとフェノタイプの間の分布の偏りがあるかないかを検定する
  • 検定手法
    • 漸近近似検定法
      • カイ自乗検定
        • 自由度は(ジェノタイプ数-1)x(フェノタイプ数-1)
    • 正確確率検定
      • 正確確率検定は、分割表の自由度が大きくなると計算量が大きくなり、非現実的。サンプル数が大きい場合は、自由度2くらいまでが現実的
    • 分割表の期待値
      • ジェノタイプ数がNg、フェノタイプ数がNpだとすると、NgxNpの観測人数が得られる。これをNgxNpのサイズの表にする。第iジェノタイプ第jフェノタイプの人数をobsijとする
      • 今、ジェノタイプ別に全フェノタイプの人数を合わせ、また、フェノタイプ別に全ジェノタイプの人数を合わせた人数を周辺度数と言う。第iジェノタイプの人数をgi、第jフェノタイプの人数をpj、総人数をNとする
      • フェノタイプとジェノタイプが独立だとすると、第iジェノタイプで第jフェノタイプである人数は、gi,pj,Nとから\frac{gi \times pj}{N}と期待される。これが、無関連という仮説のもとでの期待値である。
      • \chi^2=\sum_{all cells} \frac{(obs-exp)^2}{exp}
    • 正確確率
      • 観測テーブルの正確生起確率はProb(obs)=\frac{\Pi gi! \times \Pi pj!}{N!\Pi obsij!}
      • 観測テーブルの周辺度数から得られうるすべての分割表について、正確生起確率を計算し、観測テーブルのそれ以下のテーブルのそれの和をとる
  • ツールの出力
    • SNPケース・コントロール検定の場合
      • 第4,5行目に出力される
0.39758221083709255	2x3 Table ExactP
0.39512507274550895	2x3 Table ChiSqTestP(df=2)
      • また、第66行目にもカイ自乗検定の結果がカイ自乗統計量とともに出力される
1.8571058486775773	0.3951250727714267	2	ChiSqGenotype	
    • SNPの場合で、フェノタイプが3以上の場合
      • 第20行目以上以降に、"HeteroChi"として出力される
HeteroChi	p
1.9447559573578592	0.3781826577335774
    • CNPの場合
      • フェノタイプ数、ジェノタイプ数によって表示行は異なるが、第30−50行目あたりに、assoc Statistics p として現れる一連の出力の中で、以下のように表示される
6.108925662190422	0.2957638364360593	5	ChiSqGenotype