近似

  • 母集団がN、それがM個とN-M個の2タイプ(タイプA、タイプB)に分かれるとき、n個をサンプリングしてx個がタイプAでn-x個がタイプBであるような確率は、超幾何分布。
  • Pr(x)=Hypergeom(x,n,M,N)
  • エクセルではHYPGEOMDIST(x,n,M,N)として計算する。
  • 超幾何分布は計算が面倒くさい
  • 今、nがNの十分の1より小さいときには、Pr(x)=Hypergeom(x,n,M,N)は2項分布Pr_{binom}(x,n,M,N)=\;\;_n C_x (M/N)^x(1-M/N)^{n-x}で近似できるとされる(『統計分布ハンドブック』朝倉書店p442)。
  • また、M/Nが小さく、nが大きいときにはポアソン分布で近似できるとされるPr_{poisson}(x,n,M,N)=\frac{e^{-nM/N}(nM/N)^x}{x!}(同、p443)
  • 非常に雑に近似の程度を見てみるために作ったエクセルはこちら