条件付期待値

  • 関連する事項として以下、確認
  • 条件付期待値(Wiki記事)
  • 以下の例でやってみよう
    • Xは平均0、分散d^2正規分布に従っている。このXを観測誤差Z(ただし、平均0、分散s^2正規分布に従う)を伴ってYと観察するとする
    • Yを観測した下でのXの期待値が\hat{X}|Y = \frac{d^2}{d^2+s^2}Yであるという
  • 図の左側は真値を横軸に、観測値(黒)と条件付き期待値(赤)を縦軸にとったもの。補助線は、切片0で傾き1の直線と、観測値~真値の線形回帰直線
  • 図の右側は観測値を横軸に、真値(黒)と条件付期待値(赤)を縦軸にとったもの。補助線は、切片0で傾き1の直線と、真値~観測値の線形回帰直線。観測値に基づく真値の回帰直線が、条件付期待値とほぼ一致しているのに対して、切片0で傾き1の直線(この直線は観測値そのものを期待値とした場合の線)が回帰直線とずれていることとを示している

# Xの真値
n <- 1000
d <- 3
X <- rnorm(n,0,d)
# 誤差項
s <- 1
Z <- rnorm(n,0,s)
# 観測値
Y <- X + Z
# 条件付期待値
X. <- d^2/(d^2+s^2)*Y

par(mfcol=c(1,2))
plot(X,Y,pch=20,xlab="真値",ylab="観測値・期待値")
points(X,X.,pch=20,col=2)
abline(0,1,col=3)
lm.out <- lm(Y~X)
lm.out
abline(lm.out[[1]][1],lm.out[[1]][2],col=4)

plot(Y,X,pch=20,xlab="観測値",ylab="真値・期待値")
points(Y,X.,pch=20,col=2)
abline(0,1,col=3)

lm.out2 <- lm(X~Y)
lm.out2
abline(lm.out2[[1]][1],lm.out2[[1]][2],col=4)
par(mfcol=c(1,1))