最強力検定
- 単独検定のときの最強力検定については、Neyman-Pearson の補題を参照(こちら)
- 多仮説検定のときは事情が異なる
- FDRはその解決策の一つ
- Optimal discovery procedureもその延長線上
- False positive数を与え、その条件でTrue positive数を最大化する
- Optimal discovery procedureについてはこちら
- かいつまんで言うとこういうことか・・・
- たくさんの仮説検定がある
- そのすべて(もしくはほとんどすべて)が帰無仮説が真であって、たった一つ(もしくはごく少数)が帰無仮説を満足しない、という場合には、個々の帰無仮説棄却検定を組み合わせるという考え方で多仮説検定の評価をしてもよい
- ゲノム領域の場合はそうではない。多数の仮説は帰無仮説を満足しない。極論すれば、微小な違いも違いであるとみなすことにすれば、すべての仮説検定は帰無仮説を満足しない。
- 多数の検定が帰無仮説を満足しないことを前提とする。その点はFDRに同じ。
- 多数の対立仮説が真であるが、その内訳は不明であるので、それを決め打ちして尤度を計算するが、決め打ちの根拠がないと先に進めない。
- 多数の検定のためのデータがあることから、多数の対立仮説は、「多数の検定データ」が示している分布による、として、対立仮説のパラメタの真値でなく推定値(真値の分布でなく、推定値分布)を使う
- その結果、「基礎とする分布」が異なるのであるから、どのような真の対立仮説が真と判定され、どのような真の対立仮説が偽と判定されるかを多仮説検定のパフォーマンスとみなせば、そのパフォーマンスに差が出るのは当然。