- 昨日、検出力のことを書いた
- 独立性検定が、自由度次元空間である点を中心とした標準正規分布の生起確率を仮定し、統計量がそこからの距離の二乗に応じて減じるものであるとしたものであると示した
- 今、任意の点が真値であって、そこからの逸脱が標準正規分布であるときに、上述の独立性の検定を行う場合を考える
- ある閾値統計量以上の統計量が観測される確率がパワーである
- 今、真値(原点からの距離をとする)を中心としたk次元標準正規分布があるときの、原点からの距離の二乗の分布が、対立仮説が真のときの独立性検定のカイ二乗値の分布となる
- これは、自由度、非心パラメータの非心カイ二乗分布(Wiki)に従う
- 次元
- 真値を任意に与える
- 真値を中心に標準正規乱数を発生させ
k<-6
m<-runif(k)
mr<-sqrt(sum(m^2))
N<-10000
xs<-t(matrix(rnorm(N*k),k,N)+m)
K<-apply(xs^2,1,sum)
p<-ppoints(N,a=0)
Q<-qchisq(p,k,ncp=mr^2)
ylim<-c(0,max(K,Q))
plot(p,sort(K),type="l",ylim=ylim)
par(new=TRUE)
plot(p,Q,col=2,type="l",ylim=ylim)
plot(sort(K),Q)
abline(0,1)
- Oが原点、Xが真値の点
- aは検定閾値を決める値で、半径の球が描かれている
- が検定閾値統計量である
- 今、真値の点は原点からの距離離れている
- ここで、真値から、ランダムなずれが、直線から角度の方向にずれているとする
- この方向に距離以下、以上でずれると、検定統計量は以上になる
- 距離を求めよう
- 直角三角形を考えれば、
- 直角三角形を考えれば
- この関係から
- 掲載図とは異なり、[tex:b