- 何かしらの観測をしたときに、観測値から真値を推定しようとしている。今、何の事前情報もなければ、観測値そのものが真値である尤度が最も高い。単一対象に関する、無情報を前提とした最尤推定値が得られる。
- 一方、真値について事前分布を置き、観測値と真値のずれについても事前分布を置けば、真値の事後分布が得られる。ベイズ推定値。
- では、何かしらの分布を持っていると想定される多数の対象があるとする。それらを(同時に)観測すると、観測値には何かしらの分布が現れる。その分布は、その対象に想定していた真値の分布の様相についての情報を持っている。その真値分布の様相は事前分布として用いることができるから、それに基づいてベイズ推定することができる。これがEmpirical Bayes法。
- 本章では、真値からのずれを平均0分散1の正規分布とし、多数の対象が平均0分散Aの正規分布としたうえで、上記3つの推定値について検討する。この場合、Empirical Bayes法をJames-Stein推定と言う。
- 3つの推定方法のどれがよいかは、何かの指標で比較するべきであり、その指標としては、真値からのずれに関する最小二乗和を使っている。
- James-Stein推定では、よさの指標が、対象数が2より大きいときには、事前無情報での最尤推定よりも、小さくなることが、数式的に示せる。
- 例
- 例1
- 例2
- 例3
- 真値分布が、観測誤差分布がであるとき
- ,ここで
- 真値分布の中央が不明なときは、その値を観測データから推定する必要があり、そのために、N-2がN-3に変じている。
- 講義では、ここまでを一気に示し、例を検討することにするのがよく、最後に式変形で納得したい人に、それを課題として出すことにする
- 1.1 ベイズルールと多変量正規分布推定
- 複数の対象パラメタがある(多変量)
- その複数の対象パラメタの値はある分布に従っている()
- その複数の対象パラメタの値を観測するとする。それはに依存したものとなる()
- その観察がある分布に従うとする()
- ベイズの定理では、という観察をしたときに、の事前確率が、の下でのの生起確率を使って、であるとする
- 例
- はn個の変数であり、それが平均0、分散Aの正規分布を事前分布と考えているとする()
- 観察は、真値を平均とした、分散1の正規分布に従うとする()
- このとき、zは平均0、分散A+1の正規分布に従う
- Rでやってみる
n <- 10^6
A <- runif(1)*5
mu <- rnorm(n,0,sqrt(A))
z <- mu + rnorm(n,0,1)
mean(z)
var(z)
A
var(z) - A
-
-
- 今、興味があるのは、この分散がA+1になっている分布に従っている観測値を見て、それのもともとのパラメタ値の尤度を知ること
- あるがあるを観測値とする確率は
- パラメタ値がである事前確率はであるから
- をもたらすの尤度は、次の値に比例する
- これを整理すると
- さらに、以外の成分は、比例することだけを考慮すれば気にしなくて良いことに留意して変形すると
- となる
- これの意味するところは、の観測があったとき、それをもたらすの値の事後分布は平均、分散の正規分布であるということである
- 今、観察に対して、の推定量をとするという方法ととする方法があるが、すべてのパラメタについて、その真値からのずれを最小二乗和として評価するとそのものとするよりも、で補正した値にする方が、小さくなる(全体としてのフィッティングがよくなる)
- ずれの総和は、そのものの場合には、乱雑項をとしているから、パラメタ数そのものとなるし、補正すると、その分、小さくなる
m.mle <- z
m.jbz <- z*A/(A+1)
sum((mu-m.mle)^2)
n
sum((mu-m.jbz)^2)
n*A/(A+1)
-
- Aの値を事前想定してやれば、そのAの値を使って推定できる
- 1.2 Empirical Bayes Estimation
- このであるが、の値を推定してやれば、Aの事前想定値を決めなくても使える
- では、はどうなるか、というと、次のように考える
- 今、なるN次元正規分布なので、は、自由度Nの分布と関係する。元の正規分布の分散がA+1なので、となる
- 今、Sについて、の期待値がであることから、観測データからを算出し、の代用とすることができる
- ちなみに、の期待値がであることを示しておく
- の期待値はは分布に従う変数の期待値の定義式
- これをを用いて変形する。そのとき、であることと、分布の確率密度の積分が1になることを使う
- Rでもやっておこう
n <- 10^5
S <- (A+1) * rchisq(n,n)
mean((n-2)/S)
1/(A+1)
-
- 今、n個のパラメタについて観測値が得られたときにとしたとき、
- をJames-Stein estimatorと呼ぶ
- 3つの推定値
- 観測値を見て、他の要素とは全く独立に、観測誤差が正規乱数になっていると考えれば、z自体を推定値とするし、そのようなとき、それは最尤推定値になっている
- たくさんの観測値がえられるときに、もとのパラメタが依存する分散と、観測誤差の分散とを事前に想定してやれば、それを用いて、補正することができる。これは、事前想定を入れるから、ベイズ法
- そして、観測値からJames-Stein式にを「経験的に」求め、それを持って補正するのがEmpirical Bayes法
- 真値からのずれを、全てのパラメタの最小二乗で測れば、Aが正しければベイズ法が最小。James-Steinは最尤推定よりは小さくなる