十二分に観察する〜二項分布からポアッソン分布と正規分布

  • たくさんの機会を観察する
    • 「起きうる機会」に「こと」が1回起きる確率は、等確率pとする
  • pについて
    • 二項分布\begin{pmatrix}n\\k\end{pmatrix}p^k (1-p)^{n-k}の期待値はnp、分散はnp(1-p)
    • 今これを2つのやり方でnを大きくする
      • 期待値はnp、分散はnp(1-p)のままn\to \infty
      • 期待値np=\muを固定したままnを大きくする
        • ポアッソン分布に近づく(n\to \inftyのときにポアッソン分布となる)
        • \lim_{n\to \infty} np = \mu\lim_{n \to \infty} np(1-p) =\lim_{n \to \infty} \mu (1-p) =\lim_{n \to \infty}\mu (1-\frac{\mu}{n})=\mu
  • 「結構たくさんの回数で『起きる』」ような二項分布は正規分布に近似できる
  • 「十分にたくさんの回数すると、これ以上多数回は起きない、というような数がある」ような場合に、『これ以上多数回は起きないと言い切れるほどの多数回』を観察すると、そのうちで『起きた回数」はポアッソン分布となる
  • 正規分布へ近づける
p<-runif(1) #生起確率
# 正規分布に近づける
maxN<-100
N<-1:maxN # 試行数を増やしていく
for(i in N){
 dn<-dnorm(0:i,p*i,sqrt(p*(1-p)*i))
 db<-dbinom(0:i,i,p)
 ylim<-c(0,max(dn,db))
 plot(dn,ylim=ylim,type="l")
 par(new=TRUE)
 plot(db,ylim=ylim,type="h",col=2)
}
  • ポアッソン分布へ近づける
p<-runif(1)
m<-5
pm<-p*m
# ポアッソン分布に近づける
maxN<-100
N<-ceiling(pm):maxN
for(i in N){
 xlim<-c(0,max(pm*10,30))
 po<-dpois(0:i,pm)
 bi<-dbinom(0:i,i,pm/i)
 ylim<-c(0,max(po,bi))
 plot(po,xlim=xlim,ylim=ylim,type="h")
 par(new=TRUE)
 plot(bi,xlim=xlim,ylim=ylim,type="l",col=2)

}