自由度とパワーのこと

  • 一昨日、検出力と非心カイ二乗分布のことを書いた
  • 今、自由度が1のとき、検定のカットオフカイ二乗統計量をc1とする
  • ここで、カイ二乗統計量がc1となるような仮説が真の仮説(対立仮説)であるとすると、その真の仮説からのランダムサンプリングによって、最も観測されやすいカイ二乗値はc1c1より大のカイ二乗値を観測する確率は(およそ)0.5
  • これは、次元1の空間で\chi^2=c1の等高線の片側に入る領域の生起確率の和が(およそ)0.5ということ
  • では、自由度が上がるとどうなるか
  • 自由度1の等高線は「平たい」けれど、自由度が2以上のそれは、球面であって、球面の内外比は、次元が上がるほど、内側の比率が小さくなるので、「内側」の観測確率は小さくなる
  • これは、最も観測されやすいカイ二乗値が検定閾値より小さくなっても大きくなっても、傾向は同じ
p<-10^(-8) # 検定閾値p
c1<-qchisq(p,df=1,lower.tail=FALSE)
dfs<-1:100 # 自由度
ratio<-1.3 # 対立仮説のカイ二乗値は、検定閾値のカイ二乗値のratio倍とする
k<-dfs
checkc<-0:20
pow<-rep(0,length(dfs))
for(i in 1:length(dfs)){
	c1<-qchisq(p,df=dfs[i],lower.tail=FALSE)
	print(c1)
	pow[i]<-pchisq(c1,df=dfs[i],ncp=c1*ratio,lower.tail=FALSE)

}
plot(pow)