多項分布、ディリクレ分布への拡張



多項分布は2項分布を一般化したものである。ディリクレ分布はベータ分布を一般化したものである。2項分布とベータ分布の関係は、多項分布とディリクレ分布にもあてはまる。

  • 多項分布
    • N回の独立事象により、p=(P1,P2,...,Pk);¥sum_{i=1}^{k}Pk=1なる確率分布にて、n=(N1,N2,...,Nk);¥sum_{j=1}^{k}Nj=Nなる観測度数が得られる確率Pr(n;p)
      • Pr(n;p)=¥frac{N!}{¥prod_{i=1}^{k}Ni!}¥prod_{j=1}^{k}Pj^{Nj}
        • ¥sum_{0¥le Nj ¥le N}Pr(n;p)=1
      • ガンマ関数を使って書き直すと
        • Pr(n;p)=¥frac{¥Gamma(N+1)}{¥prod_{i=1}^{k}¥Gamma(Ni+1)}¥prod_{j=1}^{k}Pj^{Nj}
      • ガンマ関数で構成された項は、ベータ関数化したときのように、定数項と多変量ベータ関数とで表す。
    • 多変量ベータ関数(こちらも参考に)
      • B(a1,a2,...,ak) = ¥frac{¥Gamma(¥sum_{i=1}^{k}ai)}{¥prod_{j=1}^{k}¥Gamma(aj)}
      • これを用いると、Pr(n;p)のガンマ関数の項は次のように表される。
        • ¥frac{1}{(N+k-1)(N+k-2)...(N+1)}¥times ¥frac{1}{B(N1+1,N2+1,...,Nk+1)}
    • このようにして表されたPr(n;p)をnがk次空間で取りうる場合のすべてについて積分した値は1となる。2項分布で述べたのと異なり、(N+k-1)(N+k-2)...(N+1)の値が、nの取りうるすべての場合と一致しないことに注意(ただし、関係のある係数ではある)
  • ディリクレ分布
    • 多項(k項)の生起確率が、p=(P1,P2,...,Pk)で与えられるとき、pの要素が満たす条件は¥sum_{i=1}^{k} Pi =1Pi ¥ge 0であるが、この条件を満足する限りにおいて、ある有理数ベクトル分布a=(a1,a2,...ak);ai ¥ge 0を観測する確率は
      • Pr(p;a) ¥propto ¥prod_{i=1}^{k}Pi^{ai-1} ¥times ¥delta(1-¥sum_{j=1}^{k} Pi)と表せる。ただし、末尾の¥delta(1-¥sum_{j=1}^{k} Pi)は、¥sum_{i=1}^{k}Pi=1が満たされる場合に1となり、それ以外では0となるような関数であり、pの満たすべき条件を式化したものである。
      • ディリクレ分布は確率密度分布であるから、pが取りうる空間全体について積分した値が1となるべきで、上記の比例式に、係数をかけたものが、ディリクレ分布となる。この補正係数が多項化したベータ関数となっており、したがってディリクレ分布は次のように表せる。
        • Dirichlet(p;a) = ¥frac{1}{B(a1,a2,...,ak)}¥prod_{i=1}^{k}Pi^{ai-1} ¥times ¥delta(1-¥sum_{j=1}^{k} Pi)
      • これを、多項分布で用いた変数で書き換えると、ai=Ni+1なる関係があるので
        • Dirichlet(p;a) = ¥frac{1}{B(N1+1,N2+1,...,Nk+1)}¥prod_{i=1}^{k}Pi^{Ni} ¥times ¥delta(1-¥sum_{j=1}^{k} Pi)
  • 多項分布とディリクレ分布との関係
    • ¥frac{1}{(N+k-1)(N+k-2)...(N+1)}¥times ¥frac{1}{B(N1+1,N2+1,...,Nk+1)}
      • ¥sum_{n ¥in n’s space}Pr(n;p)=¥sum_{n ¥in n’s space}¥frac{1}{(N+k-1)(N+k-2)...(N+1)}¥times ¥frac{1}{B(N1+1,N2+1,...,Nk+1)}=1
    • Dirichlet(p;a) = ¥frac{1}{B(a1,a2,...,ak)}¥prod_{i=1}^{k}Pi^{ai-1} ¥times ¥delta(1-¥sum_{j=1}^{k} Pi)
      • ¥int ¥int ... ¥int _{0}^{1}Dirichlet(p,n)dp1dp2...dpk=1
    • 前者と後者がそれぞれ、ある確率分布のときにある度数分布を観測する確率と、その逆で、ある度数分布を観測したときに、ある確率分布がもととなっている尤度の分布を表している関係は、2項分布とベータ分布の場合と同じである。
    • 前者と後者との間で異なる項¥frac{1}{(N+k-1)(N+k-2)...(N+1)}は、2項分布・ベータ分布のときのように、単純にnの取りうる場合の数にはならない。なぜならば、2項分布・ベータ分布のときには、n側の変数が1つ、p側の変数が1つで、直行空間と言えるような空間中にある分布をそれぞれ、1つの次元へ射影したものに対応していたのに対し、多項分布・ディリクレ分布の場合には、n側に2以上の次元空間があり、p側にもやはり2以上の次元空間があり、それぞれの次元空間は、¥sum Pi=1¥sum Ni =Nという制約があって、同一の多次元空間分布を単純に別の平面に射影した分布となっているわけではないからである。

この制約された多次元空間は単体(simplex)と呼ばれるもので、それについての説明サイトはこちら、またはこちら。また、確率密度関数が、この単体の内部に広がる様子は、こちらのDirichlet分布の記事にある図(右上。三角形の底面に密度関数が描かれている)を参照。

この補正項は、pの次元、nの次元と、それらを合わせた次元に対応する単体の相互関係と、それらの容積・面積の対応関係によて、(おそらく)説明できると思うが、ここに書けるほど、了解していない。