Ewens sampling formula

  • Ewens sampling formulaは、集団のハプロタイプ生成状況にある条件を課したときに、標本の頻度分布の正確確率に関する式
  • これは集団遺伝学の領域では、最も単純な条件でのCoalescent過程が生成する頻度分布になる
  • Coalescent過程は頻度分布のみを定めるだけではなく、それをもたらすに至る点変異の集積状態・その時系列状況についてもモデル化したもの
  • このEwens sampling formulaは遺伝的変異とか時間とはをすっ飛ばして、たんたんと中華料理店過程で生じるテーブル別人数分布(確率的整数分割の一つ)も説明する
  • 変異・アレル頻度が中華料理店過程と頻度分布・単位線分分割・整数分割の極限として同一になるのは、変異・アレル頻度生成が、新規変異とCoalescentという2種類の確率過程の合成確率過程である一方、中華料理店過程も、新しいテーブルを選ぶ・すでにあるテーブルを確率的に選ぶという2つの確率的過程である点での一致だからのようだ(2パラメタPoisson-Dirichlet過程として同じ種類になる)