成否帰結の2択〜1番になるための戦略の一般型

  • 昨日の記事は一番じゃなきゃ、だめなんだ、の戦略の一般型の話
  • もっとも単純な決断である、「帰結は成否の2通り」x「選択肢は2つ」の場合を、一般型で表現してみる
  • s \in \mathbf{S} = \{s_0=0,s_1=1\}(選択肢)
  • z \in \mathbf{Z}=\{z_0=0,z_1=1\}(帰結)
  • \mathbf{G}=\{g=(p,1-p)\};p \in [0,1](生起確率密度分布の集合)
  • 観察\mathbf{D}=\{d_1,d_2,...,d_n\}; n=0,1,2,...であって、d_i=(s_i,z_i)である
    • ここで\mathbf{D}の要素は(0,0),(0,1),(1,0),(1,1)の4通りになるので、この場合の観察\mathbf{D}は、4つの非負整数の組\mathbf{x}=(x_{0,0},x_{0,1},x_{1,0},x_{1,1});x_{u,v} \ge 0と書き直せる
  • 今、ある観察\mathbf{D}=\mathbf(x)のもとで、ある選択肢sの帰結生起確率密度分布が、g = (p,1-p) \in \mathbf{G}である尤度(を\mathbf{G}全体の和が1となるように調整したもの)P(f_s(z)=g=(p,1-p)|\mathbf{D})=\beta(p,x_{s,0}+1,x_{s,1}+1)とするのが2項分布の共役分布ベータ分布を用いたモデル
  • 同時分布は\mathbf{G}^{|\mathbf{S}|=2}な空間に関する確率密度分布になっている(\mathbf{g}=(g_{s_1},g_{s_2}}) \in \mathbf{G}^{2})
  • この空間を次のように排他的に分割する
  • \forall \gamma^{2} = (g_{s_1},g_{s_2})のようなベクトルに対して、次の関数は必ず\mathbf{S}の部分集合(ただし空集合を除く\{\{0},\{1\},\{0,1\}\})を対応づけるものとする。
    • h(p_0=p_1)=\{0,1\}
    • h(p_0 > p_1 ) =\{0\}
    • h(p_0 < p_1 ) =\{1\}
  • とくに、この場合については、W(s|\mathbf{D})=\frac{V(s|\mathbf{D})}{\int_{s\in \mathbf{S}} V(s|\mathbf{D}) d sが比較的簡単なアルゴリズムで数値解法的に(ベータ分布を計算するのと同レベルの簡単さで)求まることはここに示した。