- 昨日、検出力のことを書いた
- 独立性検定が、自由度次元空間である点を中心とした標準正規分布の生起確率を仮定し、統計量がそこからの距離の二乗に応じて減じるものであるとしたものであると示した
- 今、任意の点が真値であって、そこからの逸脱が標準正規分布であるときに、上述の独立性の検定を行う場合を考える
- ある閾値統計量以上の統計量が観測される確率がパワーである
- 今、真値(原点からの距離を
とする)を中心としたk次元標準正規分布があるときの、原点からの距離の二乗の分布が、対立仮説が真のときの独立性検定のカイ二乗値の分布となる
- これは、自由度
、非心パラメータ
の非心カイ二乗分布(Wiki)に従う
- 次元
![k](https://chart.apis.google.com/chart?cht=tx&chl=k)
- 真値
を任意に与える
- 真値を中心に標準正規乱数を発生させ
k<-6
m<-runif(k)
mr<-sqrt(sum(m^2))
N<-10000
xs<-t(matrix(rnorm(N*k),k,N)+m)
K<-apply(xs^2,1,sum)
p<-ppoints(N,a=0)
Q<-qchisq(p,k,ncp=mr^2)
ylim<-c(0,max(K,Q))
plot(p,sort(K),type="l",ylim=ylim)
par(new=TRUE)
plot(p,Q,col=2,type="l",ylim=ylim)
plot(sort(K),Q)
abline(0,1)
![http://www.genome.med.kyoto-u.ac.jp/StatGenet/testRY20110208/powerFig.jpg](http://www.genome.med.kyoto-u.ac.jp/StatGenet/testRY20110208/powerFig.jpg)
- Oが原点、Xが真値の点
- aは検定閾値を決める値で、半径
の球が描かれている
が検定閾値統計量である
- 今、真値の点は原点からの距離
離れている
- ここで、真値から、ランダムなずれが、直線
から角度
の方向にずれているとする
- この方向に距離
以下、
以上でずれると、検定統計量は
以上になる
- 距離
を求めよう
- 直角三角形
を考えれば、
- 直角三角形
を考えれば
- この関係から
- 掲載図とは異なり、[tex:b