最小P値の分布



  • 均一な確率密度分布はU(x)=1;0¥le x ¥le 1で与えられる。
  • N回の独立サンプリングをしたときに¥alpha以下の値が1回以上起きる確率は、FWERの考え方から示される通り、P(¥alpha)=1-(1-¥alpha)^N (記事はこちら)
  • 今、N試行中、¥alphaが最小値であるということは、¥alpha以下の試行が1回以上であって、¥alpha-¥Delta ¥alpha以下の試行が0回であると言い換えられる。そのような確率は
    • P(¥alpha)-P(¥alpha-¥Delta ¥alpha)と表され、その極限をとればよい
  • したがって
    • Pr(min=¥alpha)=P(¥alpha)’ = N ¥times (1-¥alpha)^{N-1}がその確率である。
      • この確率密度分布はPr(min=0)=P(0)’=N,Pr(min=1)=P(1)’=0の単調減少関数であり、そのことからわかるように、最頻値は0である。
      • また、この確率密度分布の0から1までの積分は、確かに1となっている。¥int_{0}^{1}Pr(min=¥alpha)d¥alpha=¥[-(1-¥alpha)^{N}¥]_{0}^{1}=1
  • N回独立試行の最小値の期待値は、
    • Exp(min) = ¥int_{0}^{1} ¥alpha ¥times Pr(min=¥alpha) d¥alphaで表される。式変形すると
      • Exp(min) = ¥int_{0}^{1} (¥alpha ¥times N ¥times (1-¥alpha)^{N-1}) d¥alpha
      •  = N ¥times (¥int_{0}^{1} (1-¥alpha)^{N-1} d¥alpha - ¥int_{0}^{1} (1-¥alpha)^{N} d¥alpha )
      •  = N ¥times( -¥[¥frac{1}{N} (1-¥alpha)^{N}¥]_0^1 + ¥[¥frac{1}{N+1} (1-¥alpha)^{N+1}¥]_0^1)
      •  N ¥times (¥frac{1}{N} - ¥frac{1}{N+1})
      •  ¥frac{1}{N+1}
  • 均一分布からのN回の独立試行の最小値の期待値が、¥frac{1}{N+1}になることを確認しているエクセルはこちら1 ¥le N ¥le 1000で、最小値の期待値を100回分の平均として計算している。