メモ
- ごちゃごちゃと考えたときのメモ
- 普通のポアソン分布は非負整数を台としてその上に非負実数を配するルールをパラメタ依存に定める。そういう意味で、パラメトリックな確率分布とは、「ある台」に総和(全体の積分)が1になるような確率質量・密度を定めるルールをパラメタ依存に持っているような「確率質量・密度分布というインスタンスの集合」を定めるもの。パラメタの値を特定すれば、それはあるパラメトリックな確率分布の集合の要素を指定することになる。このようにある台の上に確率質量・密度分布を特定するlaw(決まりごと・関数)をdistributionという
- 二項分布は、サンプル数N(と生起確率(p,1-p)と)を定めることで分布インスタンスを特定する。そういう意味で「N個サンプリングする」というときのNもパラメタのひとつ
- では、Poisson-Dirichlet Distributionsはどうなるのか?
- 節4まででExchangeable partitionsについて説明を加えてきたが、それはPoisson-Dirichlet distributionsの台を説明するためだったことがわかる
ではPoisson-Dirichlet Distributionsの名前の由来は何だろうか?(これは(今のところ)想像)- さて。どういうDistributionsがあるだろうか
- ではこの節は、上記のような意味での「いろいろなPoisson-Dirichlet distributionS」をどのように説明しているか、と言うと…
- s-Paintbox
- 降順に実数列を作りその和が1未満となるようにする。1未満の総和の最後の残りをSingletons用とする
- これにより一意に定まった実数列が得られる
- ここに(0,1)の数値を発生(乱数を発生させればExchangeable "random" partitionsが得られる)させ、Singletons用の場所ならシングルトンラベルを、そうでなければ、対応セグメントのラベルをつける。これにより任意の自然数個の要素がラベル付けされる
- これを基本的なラベル付け手順とする
- s-Paitboxなラベル付け手順のもとではどのように降順実数列(足して1未満)を発生させるかの規則(law)がs-Paintboxの作られ方を決める(それがとりもなおさずdxchangeable partitionsを生む)ので、降順実数列生成lawが(Poisson-Dirichlet) distributionを表す
- Ewens distribution は、あるnに対し、ごとに、依存な確率質量分布が得られた。したがって、取りうるすべてのを台(Exchangeable partitions全体の一部)とした離散確率質量分布を定めるlawとしてのdistributionがEwens distributionであるということになる。このときが単一のパラメタなのでをパラメタとするPoisson-Dirichlet distributionと呼ばれることもある
- ディリクレ・多項分布の次元を無限大にしたときの分割がEwens's sampling formula
- 5. Two-paramter Ewens-Pitam Distributionとしての考え方