遺伝子多型解析を数か月でできるようになるために〜第5回

  • 『Applied Statistical Genetics With R』の読み会シリーズの目次
  • 2011/07/08
  • マルチプルテスティング
    • ボンフェロニ、FWER、FDR
  • その基礎
    • あるデータ(大きなデータ)が取られたとする
    • そのデータを使いまわしてたくさんの検定を行うことを考える
    • 真実の状態と、False positive, False negative
      • 真実の状態1:すべての検定で帰無仮説が真
      • 真実の状態2:ある一つの検定で対立仮説が真で、残りのすべての検定で帰無仮説が真
      • 真実の状態3:複数の検定で対立仮説が真で、残りのすべての検定で帰無仮説が真
      • 真実の状態4:すべての検定で対立仮説が真
    • False positives
      • 帰無仮説が成り立つ検定で有意になること
      • そのような検定が複数あるときに、「ひとつでもFalse positiveになる」ことを問題にするか「すべてがFalse positiveになる」ことを問題にするか、「ある割合でFalse positiveになる」ことを問題にするか、で値は変わる
      • ボンフェロニ・FWERでは「ひとつでも」である
      • FDRでは「ある割合で」である
    • False negatives
      • 対立仮説が成り立つ検定で有意にならないこと
      • そのような検定が1つあって、他は帰無仮説が成り立つ、とみなせるか、そうならないかは、検定が相互に独立であるかに依存する
      • 対立仮説が成り立つ検定のすべてが有意になることが必要なのか(ひとつでもFalse negativeがあればダメ)、対立仮説が成り立つ検定のうち、一つでもよいから有意になることが必要なのか(相互に非独立な検定が、ある真実を反映していて、どれか一つの検定で有意であれば、検出するという目的を果たしたと考える場合など)、それとも、ある一定の割合がFalse negativeになることが求められているのかで、どのように評価するかが決まってくる
      • また、「真の対立仮説」と「代理マーカー(引きずられて対立:真となるマーカー」との相互関係にも影響される値であるから、簡単にFalse negativeの評価(パワーの値)を与えにくい
  • データ全体で「違い」が有意かを見てから、個別に行くのか、そうしなくてよいのか
    • 全体としてのANOVAと個別としてのTukeyとかSheffeとか
    • 全体としての自由度2の2x3表検定と個別としての遺伝的モデル自由度1検定(優性・劣性・相加・相乗とか)