2.MCMCと正規分布の推測 ぱらぱらめくる『はじめての統計データ分析』

  • 2つの内容
  • MCMC
    • 推定の対象は分布を取る。データを生成する尤度に基づく事後分布である
    • 計算によって事後分布の最尤値をもとめたり、分布の形を求めたり、区間を求めたりするのは、大変だったり不可能だったりする
    • 事後分布がどうなっているかわからないなりに、事後分布からの標本を多数発生する方法があるなら、事後分布の「標本的分布」を知ることができる
    • MCMC方法はそのような「事後分布からの標本を発生させる」方法である
    • どうやるとそのようにできるかは理論が支えてくれるが
      • いくつかのアルゴリズムがあること
      • アルゴリズムは事後分布からまんべんなくサンプリングできることがしられていること
      • ただし、サンプリングの初期は(情報が不足しているので)よい標本ではないことも知られており、それは捨てるべきであること
  • 本テキストでは、MCMC法により事後分布が作れることを前提に話が進むが、そうは言っても、どうやっているの?というところをブラックボックスにしたままだと気持ちが悪いかもしれない→MCMC法とサンプリングアルゴリズム
  • 事後分布の評価と解釈
    • 事後分布は多数の標本分布として出てくるので、それの要約統計量を示すのがよい
      • 点推定量
        • 期待値(事後分布の期待値〜事後期待値)
        • 事後中央値
        • 事後確率最大値(事後分布の最頻値相当値)
      • ばらつき
      • 事後分散・事後標準偏差
      • 事後期待値の標準誤差
      • 区間定量
  • 事後分布の活用
    • データを得たら、次にどんな観測がなされるかの予想もできる
    • 2通りの予測
      • 事後予測分布
        • 分布のパラメタが分布しているので、得られるであろう値はそのパラメタ分布が生じるだろう分布の重み付き総和になる
        • その期待値、というものもあるし、その分布そのものというものもある
      • 条件付き予測分布
        • パラメタの推定結果は分布だけれど、その点推定値を用いて、事後分布を一つ、定めることもできる
    • その他、色々な知りたいことの事後分布が得られる
      • クオンタイル点、何かと何かの比、など
      • いずれも、他の推定分布が解るだけでは分布が取れないかもしれないので、MCMCしながら分布を取るのが得策