超幾何分布確率の計算とそれを2項分布で近似すること
- 超幾何分布
- 母集団の個体数が
- 母集団の個体は特性Aの有無で2種類に分けられ、その数はとである
- 特性Aを有する比率
- 今、標本をサンプリングし、そのうち、が特性を有し、それ以外が有していないとする(
- このような標本を得る確率は、超幾何分布になり、次のようになる
- ただし、で、全体でN個からM個とN-M個の割り振りで取り出す組み合わせのことである
- であることは言うまでもない
- 2項分布
- 今、母集団の個体数は不明(不明なほど大きい、不要)
- 特性Aを有する比率
- 標本は同じく、をサンプリングし、そのうち、が特性を有し、それ以外が有していないとする
- このような標本を得る確率は、母集団個体数が無限大であるとして
とされる。
Nが大きいと、後者の値は前者に近くなり、(前者の計算は面倒くさいので)、後者で近似することが妥当になる。
この近似のよさ(悪さ)を試すエクセルはこちら
参考サイトはこちら
このサイトにたどりつくにあたって経由したサイトはこちら