Chapter 4 False Discovery Rate Control ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

  • FDRというのは、「何をもって閾値を決めるか」の態度の一つ。FDRと異なる態度が「タイプIエラー率を(たとえば)0.05にする」という態度。FDRの態度はそれとは違って、別のものをコントロールしようとしている
  • 4.1 True and False Discoveries
    • たくさんのテストがあると、そのうち、帰無仮説が成り立つものと対立仮説が成り立つものの両方がある。その上で、ある閾値を入れて、「採択・非採択」を決めると、2x2表ができる
    • タイプ1エラーを問題にするときは、本当は帰無仮説が正しいのに採択される割合を問題にし、FDRでは、採択にする割合をいくつにするとそのうちどれくらいが帰無仮説を満足しているかを問題にする
    • FDRができるのは2x2表が作れる状況(たくさんのテストがある状況)だからである
  • 4.2 Benjamini and Hochberg's FDR Control Algorithm
    • 帰無仮説がなりたっている方のテストではp値が一様分布に従い、対立仮説が成り立っている方のテストではそうではない、ということを前提に補正する
    • p値にFDRコントロールで適当な閾値を見つける方法
ps <- runif(100)
ps <- c(ps,runif(30)*0.01)
ps.c <- p.adjust(ps,method="BH")
plot(ps,ps.c,xlim=c(0,1),ylim=c(0,1))
  • 4.3 Empirical Bayes Interpretation
    • q-value: 1-qの確率で採択されたテストは本物と考えられる、と説明するための値
    • テスト同士が独立であると仮定した手法だが、テスト同士が独立でない場合の方が、有意と採る確率が上がるので、保守的。False negativesよりFalse positiveの量を気にする状況では、この点の心配が緩い
  • 4.4 Is Fdr Control "Hypothesis Testing"?
    • 個々のテストについて対立仮説である確率はどれくらい?と言う推定をしていると考えるのがよさそうであって、帰無仮説を棄却する方法ではないと考える方が妥当(との著者の意見)
  • 4.5 Variations on the Benjamini-Hochberg Algorithm
  • 4.6 \bar{Fdr} and Simultaneous Tests of Correlation
    • p値が帰無か対立かの比率推定をしてくれるBH法であるが、同時に観測したデータで尺度間の遠近関係をとって、近すぎる関係なのかどうか、というのを、全ペアの遠近分布に照らして評価することもできる