均一確率分布からの最小P値の分布



2006年12月5日の記事に、この件を書いた。そのときは、FWERの考え方と微分の考え方から、

Exp(min) = ¥int_{0}^{1} (¥alpha ¥times N ¥times (1-¥alpha)^{N-1}) d¥alpha

なる式を示した。

この式の由来を幾何学的に考える。

均一確率分布からの独立なN回のサンプリングは、辺の長さが1のN次元立方体からのサンプリングであると考える。1回のサンプリングにより、N個の次元に相当するN個の値が得られる、その中で、最小の値が何か、それをN次元立方体全体について検討して期待値を出すにはどうするか、という問題であることがわかる。

今、N次元立方体において、最小値が¥alphaとなるような部分は、どのような部分だろうか。

N=2の場合を考える。このときは、x1=¥alpha または  x2=¥alphaを満足するような、長さ1-¥alphaからなる、L字型部分(2直線で構成された部分:2つの、1次元成分)である。N=3の場合を考える。この場合はx1=¥alphaまたはx2=¥alphaまたはx3=¥alphaを満足するような、3平面で構成された部分(3つの、2次元成分、それぞれ、(1-¥alpha)^2)である。次元を拡張してN次元のそれは、N個のN-1次元成分((1-¥alpha)^{N-1})からなる。

したがって、¥int_{0}^{1} (¥alpha ¥times N ¥times (1-¥alpha)^{N-1}) d¥alphaにて、その期待値が算出されることがわかる。この値が¥frac{1}{N+1}であることは、2006年12月5日の記事に示したとおりである。