6 遺伝子多型分割表データの関連検定の見方 SNPケースコントロール関連検定に見る、いろいろな検定

  • SNPは3ジェノタイプ
    • この3ジェノタイプは、それぞれがどんなリスクを持っているか、知れたものではない、という意味では、相互に順序できない3カテゴリともみなせる
    • この3ジェノタイプは、2アリルのうちの片方に着目すると、0本、1本、2本という明らかな順序があるので、順序つきカテゴリとみなすことも、自然である
  • ケース・コントロールは2フェノタイプ
  • 2カテゴリは、それに順序があるとみなしても、こちらかあちらか、という判断しかできないので、ある軸について順序があるものとみなせるので、必ず、順序有りカテゴリである
  • 『どんな関連』かによる『いろいろ』
    • 3ジェノタイプカテゴリのどれにどれくらいリスクがあったとしても、それを信じよう、というような関連の見方
      • 特定の関連の見方に対する『いろいろ』な関連検定手法には、次のような分け方がある
        • 漸近近似検定(算術的に計算できる統計量を計算し、その統計量を既知の確率密度分布に照らしてp値とする方法)と、それに対応する正確確率検定のペアが、ほぼ必ず存在し、それが『いろいろ』な手法として数を増やす
          • 漸近近似検定は、計算が簡単だが、サンプル数がすくなくなると、誤差が無視できなくなる
          • 正確確率検定は、計算は面倒だが、サンプル数がすくなくても、正確である
        • 同じ見方に、複数の漸近近似統計量が知られている場合も、手法の数が増える。Additive modelにおける、Trend カイ自乗統計量と、Cockran-Armitage統計量とがそれである。この2つはどちらも自由度1のカイ自乗分布で評価されるもので、互いに似通った値となるが、わずかに算出式が異なる。この違いは、たいてい無視しえるレベルである。これを無視したくない向きには、正確確率検定を持ちいればよい。この2つの正確確率検定は、まったく同一のそれとなっているからである。
      • ジェノタイプモデル
    • 片方のアリルの所有本数に比例してリスクが発生するという関連の見方
      • Additive modele
    • 優性遺伝形式でリスクが発生するだろうという関連の見方
      • 優性モデル
    • 劣性遺伝形式でリスクが発生するだろうという関連の見方
      • 劣性モデル
  • 1つの見方に存在する複数の検定手法
    • ジェノタイプモデルの場合
      • 2x3分割表カイ自乗検定(自由度2)
      • 2x3分割表正確確率検定
    • Additive model
      • 3ジェノタイプの重み付けを{0,1,2}とする傾向性カイ自乗検定(自由度1)
      • Cockran-Armitage傾向性検定(自由度1)
      • 染色体本数として2x2分割表を作成しなおして、カイ自乗検定(自由度1)・・・本当は不適切な手法
      • 作成しなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
    • 優性モデル
      • 3ジェノタイプを優性モデルに照らして2群に分け、2x3分割表を2x2分割表に作成しなおした上で行うカイ自乗検定(自由度1)・・・分割表の作り直しなので、不適当に感じられるが、適切な手法
      • 3ジェノタイプの重み付けを{1,1,0}として実施する傾向性カイ自乗検定(自由度1)。2x2ジェノタイプ分割表を作り直して実施するカイ自乗検定とまったく同じ
      • 作りなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
    • 劣性モデル
      • 3ジェノタイプを劣性モデルに照らして2群に分け、2x3分割表を2x2分割表に作成しなおした上で行うカイ自乗検定(自由度1)・・・分割表の作り直しなので、不適当に感じられるが、適切な手法
      • 3ジェノタイプの重み付けを{1,0,0}として実施する傾向性カイ自乗検定(自由度1)。2x2ジェノタイプ分割表を作り直して実施するカイ自乗検定とまったく同じ
      • 作りなおした2x2分割表について実施する正確確率検定・・・作り直した分割表に基づく正確確率の計算は不正確なので、不適切な手法
    • その他の手法
      • SNPの解析では、上記の手法が主に見られるが、CNPの解析ではその他の手法がメジャーなペイパーにも登場する。SNPは2アリル3ジェノタイプ型のCNPともみなせるので、参考のために、それらの手法についてもここで言及する。
        • CNPでは、ジェノタイプのコピー数和で、サンプルに順位をつけ、順位和検定を行うことがある。Mann-Whitney検定である。これは、ケースとコントロールの2群に差がないならば、ケースの順位とコントロールの順位はランダムであるはずである、という考え方に基づく。同順位が非常に多い点が不適切度を上げることは確かだが、考え方として間違ってはいない。
        • CNPでは、コピー数和の多寡に基づいて、適当に2群に分けて、2x2分割表検定をすることもある。これは、SNPの場合には、優性・劣性モデルで2x2分割表検定をすることに相当する。
      • また、フェノタイプが量的な場合に用いる手法も、ケース・コントロールの形質を0,1という量であるとみなすことで適用可能であるので、それらの手法についてもここで言及する。
        • 線形回帰検定。フェノタイプがジェノタイプ(特定アリルの保有本数)の線形関数であるいうモデルをあてはめて、帰無仮説に照らしてp値化するもの
        • その他、ロジスティック回帰もあるが、ここでは省略(計算が、一段階面倒くさくなるため)。
  • ツールの結果を見る
    • 見方でもう一度分類しなおす
      • ジェノタイプを順序なしカテゴリとする
        • (1)2x3分割表のカイ自乗検定
        • (2)その正確確率検定
      • 特定モデル
        • Additive model相当
          • 傾向性検定
            • (3)Cockran-Armitage
            • (4)Trend カイ自乗検定
          • (5)アリルの2x2表カイ自乗検定
          • (6)アリルの2x2表正確確率検定
          • (7)Mann-Whitney
          • (8)線形回帰
        • 優性モデル相当
          • (9)2x2表作り直しカイ自乗検定
          • (10)2x2表作り直し正確確率検定
          • (11){1,1,0}重み付けの傾向性カイ自乗検定
        • 劣性モデル相当
          • (12)2x2表作り直しカイ自乗検定
          • (13)2x2表作り直し正確確率検定
          • (14){1,0,0}重み付けの傾向性カイ自乗検定
      • 見方が同じ手法のP値は似通っている、また、まったくの同一手法でありながら、異なる呼び名のものは、同一の値であることも見て取れる

0.5569044977710992 2x3 Table ExactP

    • サンプル2x3分割表
49	42	9	
45	41	14	
    • 結果
---ジェノタイプを順序なしカテゴリとする
(1)	0.5301428713204794	2x3 Table ChiSqTestP(df=2)
(2)	0.5569044977710992	2x3 Table ExactP
---Additive model相当
(3)	0.34875306900807446	Cockran-Armitage Trend P
(4)	0.34754490657479753	TrendChiSqP
(5)	0.33569583486055254	2x2 Table of allele ChiSqTestP(df=1)
(6)	0.3921877553862013	2x2 Table of allele ExactP
(7)	0.404569198365313	Mann-Whiteney
(8)	0.3500426506596672	Linear Regression
---優性モデル相当
(9)	0.26775748628257956	Dominant model ChiSqP
(10)	0.3756881440915198	2x2 Table of Dominant model ExactP
(11)	0.26775748628257967	{1,1,0}TrendP
---劣性モデル相当
(12)	0.5709136609062897	Reccesive model ChiSqP
(13)	0.6709271228577122	2x2 Table of Reccesive model ExactP
(14)	0.5709136609062893	{1,0,0}TrendP

###書きかけ

  • 分割表の見方〜ジェノタイプ・フェノタイプの重み付け
    • 2カテゴリのとき、それは、必ず順序が想定される=ケース・コントロール関連検定は、どの手法を用いるにせよ、必ず、ケース・コントロールには0か1かという順序が取り込まれて解析される
    • 常染色体多型のジェノタイプは、SNPを含むすべての多型でジェノタイプ数が必ず3以上なので、順序を想定するか否かの判断を必ずする必要がある
    • カテゴリの順序の想定の有無による、解析の分類
ジェノタイプ-> 順序なしカテゴリ 順序ありカテゴリ
フェノタイプ
ケース・コントロール Heterogeneity検定 傾向性の検定,Mann-Whitney
3カテゴリ以上、順序なし Heterogeneity検定 Kruskal-Wallis
3カテゴリ以上、順序あり Kruskal-Wallis Jockheere-Terpstra