ベルヌーイ分布のパラメタを推定する

  • 前の記事で二項乱数から平均と分散を推定する話を書いた
  • たとえば、ある生起確率pでn=20のサンプリングをしたとすれば
p <- pi/4
n <- 20
X <- sample(0:1,n,replace=TRUE,prob=c(1-p,p))
mean(X)
var(X)
sum((X-mean(X))^2)/n
> mean(X)
[1] 0.8
> var(X)
[1] 0.1684211
> sum((X-mean(X))^2)/n
[1] 0.16
  • となる。
  • ベルヌーイ分布で期待値がqなら、ベルヌーイ分布は\begin{pmatrix}n\\k \end{pmatrix} q^k(1-q)^{n-k}で、その分散はq(1-q)である
  • 上の例からすれば、q=0.8で、そのq(1-q)=0.16となり、標本からの不偏分散とは違う
  • 標本分散とは合致する
  • では、「標本平均を母分布の平均の期待値とし、標本からの不偏分散を母分布の分散の期待値とする」というのは、ベルヌーイ分布を推定しているのとは違うことになる
  • さて。
  • ベルヌーイ分布は1変数分布なので、ベルヌーイ分布の推定をするとは、1個のパラメタを推定してしまったら、分布が確定するのだから、期待値を推定しようが、分散をしようが、推定するべきは、1パラメタの値のはず
  • 成功a,失敗bのときの尤度は成功確率pにつき、ベータ分布だからL(p) \propto p^a (1-p)^bとなる
  • 最尤推定するならp=\frac{a}{a+b}となる