イーエンス確率分割 Ewens sampling formula

  • 個票開示問題とは個人が特定される問題
  • イーエンス確率分割とピットマン確率分割
    • こちらのPDFを参照
    • Ewensはn個の中立な遺伝子変異が作る異なる遺伝子型の分割としてイーエンス確率分割を導いた
    • イーエンス確率分割を1形態として含む、より一般化した確率分割としてピットマン確率分割がある
  • 個票開示問題は、多次元分割表における、母集団における一意セルの数・標本集団における一意セルの数の問題
    • これを考えてやるときに、多項分布→多項分布をディリクレ分布で混合(多項・ディリクレモデル)、ポアソ分布→ポアソン分布の期待値パラメタにガンマ分布を仮定→負の2項分布(ポアソン・ガンマモデル)、ポアソン・ガンマモデルから、0意セル数を無限大発散させる→Fisherの対数級数モデル、ここでさらに母集団の大きさを固定するとEwens sampling formulaになる、という関係にあるという・・・(こちらを参照)
  • これらがつながっていることをイメージで感じるには、Ewens sampling formulaとその一般型であるピットマンsampling formulaとに出てくる「下駄を履かせる項」がディリクレ分布の「下駄」に共用されている、ことを思い出せばよいのだろうか。それとも、この2箇所の下駄は両者の分布としてのつながりには関係がないのだろうか???