1番になるための戦略の一般型
- 昨日の記事も一番じゃなきゃ、だめなんだ、の戦略の話
- 今日の記事はそれを一般型にして書き下してみる
は選択肢とその集合
は帰結とその集合
- 帰結空間
に関する確率密度分布の集合(限定すればそれは統計モデルになるが)を
とする
- 今、選択肢
における真の帰結生起確率密度分布を
とする
- 観察
であって、
である
- 今、ある観察
のもとで、ある選択肢
の帰結生起確率密度分布が、
である尤度(を
全体の和が1となるように調整したもの)を
とする
- ここで、すべての選択肢に関して、それが選択されたときに、その選択が最善であるような確率について興味があるものとする
- それを考えるために、次のような同時分布を考える
- この同時分布は
な空間に関する確率密度分布になっている(
)
- この空間を次のように排他的に分割する
のようなベクトルに対して、次の関数は必ず
の部分集合(ただし空集合は除く)を対応づけるものとする。
- ここで、
について
を定め、これを
の
における重みとし、さらに
とすれば、これが
が観察されている下での
を選ぶ確率
- である、というのが、ここ数日の『1番じゃなきゃ、だめなんだ』戦略らしい(多分、合っている)