積み上げる

  • 空間\Omegaがあって、そこの座標を\mathbf{x}とする
  • 多項事象Z=\{z_j\}があって、この空間に事象が観察されるとX=\{\mathbf{x}_i\}Y=\{y_i=z_{j_i}\}が得られる
  • ここで、個々の観察y_i=z_{j_i}対して、それを\mathbf{x_i}を中心とした正規分布で空間に起きたとみなせば、その総和は積分が検体数の分布を作る
  • この分布に照らすと、空間の任意の点には事象の種類数の長さの「生起回数ベクトル」が定まる
  • この生起回数ベクトルから、その座標での事象の生起確率の期待値が求められる
  • また生起回数ベクトルに応じてディリクレ分布をとれば、空間にディリクレ分布の、その分布が得られる。これは正規分布の取り方(と観察)による
  • 今、この生起期待値(とディリクレ分布)に照らして、この観察の尤度を考えることにする
  • 各座標での生起事象はわかっており、そこでの生起確率の期待値もわかっているから、それが尤度に影響することはわかる
  • 正規分布の取り方の良しあしを評価するには、ここに、正規分布の取り方(1観察をどのような減衰状況で空間に広げるか)に関する軽重を入れる必要がある
  • その軽重は、「たくさんの観察が行われた座標」では重く、「ほとんど観察されていない座標」では軽くしたい
  • それは各座標での生起回数ベクトルとして計算されている
  • これを使って、「生起回数ベクトルの総和」の観察がなされて、その内訳がそのベクトルの要素である、としてしまうと、重すぎる
  • 極端な例を考えてみる
  • 空間の2座標にしか観察されず、そこにN1,N2の観察がなされ、その事象の内訳がわかっているとき\frac{(N1+1)!}{n_{1,1}! n_{1,2}!} p^{n_{1,1}}(1-p)^{n_{1,2}}というような分布(ベータ分布の場合)を考えるだろう。これは、ある座標に観測されたN1検体の総和に相当する
  • では、これを個々の観察に分解すれば(\frac{(N1+1)!}{n_{1,1}! n_{1,2}!} p^{n_{1,1}}(1-p)^{n_{1,2}})^{\frac{1}{N1}}としてそのN1個の掛け合わせ、と考えてもよいだろうか
  • こうすれば、「生起回数ベクトル」をこのN1,n_{1,1}等に当て嵌めることで対応がとれるが…
  • さて、これの真偽は???