遺伝子多型解析を数か月でできるようになるために〜第5回
- 『Applied Statistical Genetics With R』の読み会シリーズの目次
- 2011/07/08
- マルチプルテスティング
- ボンフェロニ、FWER、FDR
- その基礎
- あるデータ(大きなデータ)が取られたとする
- そのデータを使いまわしてたくさんの検定を行うことを考える
- 真実の状態と、False positive, False negative
- False positives
- 帰無仮説が成り立つ検定で有意になること
- そのような検定が複数あるときに、「ひとつでもFalse positiveになる」ことを問題にするか「すべてがFalse positiveになる」ことを問題にするか、「ある割合でFalse positiveになる」ことを問題にするか、で値は変わる
- ボンフェロニ・FWERでは「ひとつでも」である
- FDRでは「ある割合で」である
- False negatives
- 対立仮説が成り立つ検定で有意にならないこと
- そのような検定が1つあって、他は帰無仮説が成り立つ、とみなせるか、そうならないかは、検定が相互に独立であるかに依存する
- 対立仮説が成り立つ検定のすべてが有意になることが必要なのか(ひとつでもFalse negativeがあればダメ)、対立仮説が成り立つ検定のうち、一つでもよいから有意になることが必要なのか(相互に非独立な検定が、ある真実を反映していて、どれか一つの検定で有意であれば、検出するという目的を果たしたと考える場合など)、それとも、ある一定の割合がFalse negativeになることが求められているのかで、どのように評価するかが決まってくる
- また、「真の対立仮説」と「代理マーカー(引きずられて対立:真となるマーカー」との相互関係にも影響される値であるから、簡単にFalse negativeの評価(パワーの値)を与えにくい
- データ全体で「違い」が有意かを見てから、個別に行くのか、そうしなくてよいのか
- 全体としてのANOVAと個別としてのTukeyとかSheffeとか
- 全体としての自由度2の2x3表検定と個別としての遺伝的モデル自由度1検定(優性・劣性・相加・相乗とか)