6 遺伝子多型分割表データの関連検定の見方 SNPケースコントロール関連検定に見る、いろいろな検定
-
- 公開アプリケーションはこちら
- SNPは3ジェノタイプ
- この3ジェノタイプは、それぞれがどんなリスクを持っているか、知れたものではない、という意味では、相互に順序できない3カテゴリともみなせる
- この3ジェノタイプは、2アリルのうちの片方に着目すると、0本、1本、2本という明らかな順序があるので、順序つきカテゴリとみなすことも、自然である
- ケース・コントロールは2フェノタイプ
- 2カテゴリは、それに順序があるとみなしても、こちらかあちらか、という判断しかできないので、ある軸について順序があるものとみなせるので、必ず、順序有りカテゴリである
- 『どんな関連』かによる『いろいろ』
- 3ジェノタイプカテゴリのどれにどれくらいリスクがあったとしても、それを信じよう、というような関連の見方
- 特定の関連の見方に対する『いろいろ』な関連検定手法には、次のような分け方がある
- 漸近近似検定(算術的に計算できる統計量を計算し、その統計量を既知の確率密度分布に照らしてp値とする方法)と、それに対応する正確確率検定のペアが、ほぼ必ず存在し、それが『いろいろ』な手法として数を増やす
- 漸近近似検定は、計算が簡単だが、サンプル数がすくなくなると、誤差が無視できなくなる
- 正確確率検定は、計算は面倒だが、サンプル数がすくなくても、正確である
- 同じ見方に、複数の漸近近似統計量が知られている場合も、手法の数が増える。Additive modelにおける、Trend カイ自乗統計量と、Cockran-Armitage統計量とがそれである。この2つはどちらも自由度1のカイ自乗分布で評価されるもので、互いに似通った値となるが、わずかに算出式が異なる。この違いは、たいてい無視しえるレベルである。これを無視したくない向きには、正確確率検定を持ちいればよい。この2つの正確確率検定は、まったく同一のそれとなっているからである。
- 漸近近似検定(算術的に計算できる統計量を計算し、その統計量を既知の確率密度分布に照らしてp値とする方法)と、それに対応する正確確率検定のペアが、ほぼ必ず存在し、それが『いろいろ』な手法として数を増やす
- ジェノタイプモデル
- 特定の関連の見方に対する『いろいろ』な関連検定手法には、次のような分け方がある
- 片方のアリルの所有本数に比例してリスクが発生するという関連の見方
- Additive modele
- 優性遺伝形式でリスクが発生するだろうという関連の見方
- 優性モデル
- 劣性遺伝形式でリスクが発生するだろうという関連の見方
- 劣性モデル
- 3ジェノタイプカテゴリのどれにどれくらいリスクがあったとしても、それを信じよう、というような関連の見方
- 1つの見方に存在する複数の検定手法
- ジェノタイプモデルの場合
- 2x3分割表カイ自乗検定(自由度2)
- 2x3分割表正確確率検定
- Additive model
- 3ジェノタイプの重み付けを{0,1,2}とする傾向性カイ自乗検定(自由度1)
- Cockran-Armitage傾向性検定(自由度1)
- 染色体本数として2x2分割表を作成しなおして、カイ自乗検定(自由度1)・・・本当は不適切な手法
- 作成しなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
- 優性モデル
- 3ジェノタイプを優性モデルに照らして2群に分け、2x3分割表を2x2分割表に作成しなおした上で行うカイ自乗検定(自由度1)・・・分割表の作り直しなので、不適当に感じられるが、適切な手法
- 3ジェノタイプの重み付けを{1,1,0}として実施する傾向性カイ自乗検定(自由度1)。2x2ジェノタイプ分割表を作り直して実施するカイ自乗検定とまったく同じ
- 作りなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
- 劣性モデル
- 3ジェノタイプを劣性モデルに照らして2群に分け、2x3分割表を2x2分割表に作成しなおした上で行うカイ自乗検定(自由度1)・・・分割表の作り直しなので、不適当に感じられるが、適切な手法
- 3ジェノタイプの重み付けを{1,0,0}として実施する傾向性カイ自乗検定(自由度1)。2x2ジェノタイプ分割表を作り直して実施するカイ自乗検定とまったく同じ
- 作りなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
- その他の手法
- SNPの解析では、上記の手法が主に見られるが、CNPの解析ではその他の手法がメジャーなペイパーにも登場する。SNPは2アリル3ジェノタイプ型のCNPともみなせるので、参考のために、それらの手法についてもここで言及する。
- また、フェノタイプが量的な場合に用いる手法も、ケース・コントロールの形質を0,1という量であるとみなすことで適用可能であるので、それらの手法についてもここで言及する。
- ジェノタイプモデルの場合
- ツールの結果を見る
- 見方でもう一度分類しなおす
- ジェノタイプを順序なしカテゴリとする
- (1)2x3分割表のカイ自乗検定
- (2)その正確確率検定
- 特定モデル
- Additive model相当
- 傾向性検定
- (3)Cockran-Armitage
- (4)Trend カイ自乗検定
- (5)アリルの2x2表カイ自乗検定
- (6)アリルの2x2表正確確率検定
- (7)Mann-Whitney
- (8)線形回帰
- 傾向性検定
- 優性モデル相当
- (9)2x2表作り直しカイ自乗検定
- (10)2x2表作り直し正確確率検定
- (11){1,1,0}重み付けの傾向性カイ自乗検定
- 劣性モデル相当
- (12)2x2表作り直しカイ自乗検定
- (13)2x2表作り直し正確確率検定
- (14){1,0,0}重み付けの傾向性カイ自乗検定
- Additive model相当
- 見方が同じ手法のP値は似通っている、また、まったくの同一手法でありながら、異なる呼び名のものは、同一の値であることも見て取れる
- ジェノタイプを順序なしカテゴリとする
- 見方でもう一度分類しなおす
0.5569044977710992 2x3 Table ExactP
-
- サンプル2x3分割表
49 42 9 45 41 14
-
- 結果
---ジェノタイプを順序なしカテゴリとする (1) 0.5301428713204794 2x3 Table ChiSqTestP(df=2) (2) 0.5569044977710992 2x3 Table ExactP ---Additive model相当 (3) 0.34875306900807446 Cockran-Armitage Trend P (4) 0.34754490657479753 TrendChiSqP (5) 0.33569583486055254 2x2 Table of allele ChiSqTestP(df=1) (6) 0.3921877553862013 2x2 Table of allele ExactP (7) 0.404569198365313 Mann-Whiteney (8) 0.3500426506596672 Linear Regression ---優性モデル相当 (9) 0.26775748628257956 Dominant model ChiSqP (10) 0.3756881440915198 2x2 Table of Dominant model ExactP (11) 0.26775748628257967 {1,1,0}TrendP ---劣性モデル相当 (12) 0.5709136609062897 Reccesive model ChiSqP (13) 0.6709271228577122 2x2 Table of Reccesive model ExactP (14) 0.5709136609062893 {1,0,0}TrendP
###書きかけ
- 分割表の見方〜ジェノタイプ・フェノタイプの重み付け
ジェノタイプ-> | 順序なしカテゴリ | 順序ありカテゴリ |
---|---|---|
フェノタイプ | ||
ケース・コントロール | Heterogeneity検定 | 傾向性の検定,Mann-Whitney |
3カテゴリ以上、順序なし | Heterogeneity検定 | Kruskal-Wallis |
3カテゴリ以上、順序あり | Kruskal-Wallis | Jockheere-Terpstra |