複数の独立な検定のP値のプロットが直線になることについてのメモ
N個の独立な検定を行って、そのP値を昇順にソートし、横軸に1からNまでの自然数を、縦軸にP値をとると、の直線に近似できる。これを組み合わせと、期待値の算出などを使って確かめてみるとすると、どういう風になるか、のメモ。
- 独立な検定で、帰無仮説が正しいとすると、それを検定したときに得られるP値の値がとなる確率分布は、0から1に渡って均一で、となる。これは、P値の定義である。
- このようなとき、P値の期待値はである。
- 今、N回の検定を行うとしたときに、P値が未満になるような試行が回起きたとしよう。このの期待値がいくつになるかを考える。
- 未満のP値を持つ検定試行は、0回か、1回か、2回か、…N回のいずれかである。
- k回の試行のP値が未満になる確率をとすると、
- と表せる。
- 未満のP値を持つ検定試行の回数の期待値は、で表される。
- この計算をするとであることがわかり、本記事の冒頭の記載が正しいことがわかる。N=100 のときについて、k=0,...,Nの確率から期待値を計算するエクセルファイルはこちら。