Poisson 点過程で作る Random Exchangeable Partitions - ryamadaの遺伝学・遺伝統計学メモ

Stick breaking process/中華料理店過程でExchangeable random partitionsが作れることを前の記事で書いた
同じことを別の作り方として表現できる
正の値をランダムに発生させ、その総和が1になるように標準化すれば、足して1になる多数の(無限の)正の数の集合ができる。これは今、欲しい値の集合である
ただし、これができるには、総和が有限になるようにランダムな値を発生させることである
この $(0,\infty)$ に値をランダムに発生させつつ、その総和の極限が発散しないような作り方をPoisson 点過程を用いた単位線分の分割作成法と言う
この発散しないような発生方法を、 $(0,\infty)$ に定義された確率密度関数に基づく乱数発生とみなせば、確率密度関数を指定することでRandom Exchangeable Partitionsが定義できる
たとえば、指数分布で発生させたとする。指数乱数はポアソン過程の間隔の分布なので、指数乱数の総和は、ポアソン過程で発生する事象の最後のイベントが起きる時刻に相当する。しかしながら、今、イベント数は無限回にしようとしているので、その総和は無限大になる。このことからわかるのは、指数分布は単調減少する確率密度分布だが、それに従う乱数を使ったのでは、今の用途には不適切だということ
$P(x) = \frac{1}{x}e^{-x}$ のような分布は指数分布よりも減衰が早い分布なので、これなら(多分)使える
さて。前の記事で、Poisson-Dirichlet Processについて書いた。このPoisson-Dirichlet Processは２つのパラメタ $\alpha,\theta$ で定まる過程であったが、これに対応する確率密度分布があって、それにしたがって乱数を発生させ、それの総和を取って除するという処理で単位線分タイルの長さを決めると、Poisson-Dirichlet Processの分割分布になることが知られている
そのような関数として $x^{-\alpha-1}$ とか $\theta x^{-1} e^{-x}$ などがある
さらに、そのような確率密度関数に対応するProbability Generating Functionalのラプラス変換の式は、 $\alpha,\theta$ に関して連続して定義できることも知られている(こちらの2ページから3ページにかけて)
[tex(0,\infty)]の範囲に点が発生する過程であって、位置によって点の発生確率が異なるので、これをinhomogeneous Poisson point processと言う