L1ノルムで中央値、L2ノルムで平均値

  • 標本平均値は、標本の値の和を標本の数で割ることでえらる
  • それは、標本から推定された期待値
  • それは、L2ノルムの和を最小にするような値
  • 標本の中央値は、ソートして真ん中に来る値
  • それは、L1ノルムの和を最小にするような値
  • こちらも参考

x <- c(rnorm(100,0,1),rnorm(200,3,1))
plot(x)
hist(x)

mean(x)
median(x)

X <- seq(from=min(x),to=max(x),length=1000)

L1 <- L2 <- rep(0,length(X))

for(i in 1:length(X)){
	L1[i] <- sum(abs(x-X[i]))
	L2[i] <- sum((x-X[i])^2)
}

matplot(X,cbind(L1,L2),type="l")

abline(v=mean(x),col=3)
abline(v=median(x),col=4)
abline(h=min(L1),col=3)
abline(h=min(L2),col=4)