サンプル数を多くする

  • こちらで頻度を比較している
  • 2x2分割表を考える
A a
X 5 10
Y 11 20
  • このようなテーブルのサンプル数が、このテーブルでは総検体数が46だが、これを46x2,46x3…と増やしていくと、カイ二乗値は、2倍、3倍・・・と増えていく
  • p値は小さくなっていく
  • ピアソンのカイ二乗テストでは、
t<-matrix(c(5,10,11,20),ncol=2,byrow=TRUE)

N<-10
chip<-chisq<-rep(0,N)
for(i in 1:N){
	t2<-t*i
	tmp<-chisq.test(t2,correct=FALSE)
	chisq[i]<-tmp[[1]]
	chip[i]<-tmp[[3]]
}
par(mfcol=c(1,2))
plot(chisq,main="statistics")
plot(chip,main="p")

par(mfcol=c(1,1))
  • 同様に、こちらでも、「確率」で検定すると、「検体数」が少ないので、検定統計量は小さく、p値は大きくなる
finalp<-c(0.5579265,0.5443338,0.5317352,0.5231784,0.4937143,0.4812046,0.4791171,0.4593829,0.4293001)
N<-10
finalp<-finalp*100
people<-9
library(gtools)
battle.cmb<- combinations(people,2)
#chiscore<- rep(0,nrow(battle.cmb))
chiPM<-matrix(0,36,N)
chiStM<-matrix(0,36,N)
for(ch in 1:nrow(battle.cmb)){
	for(j in 1:N){
		tmp<-finalp*j
		tmpout<-chisq.test(tmp[battle.cmb[ch,]])
		chiPM[ch,j]<-tmpout[[3]]
		chiStM[ch,j]<-tmpout[[1]]
	}
}
par(mfcol=c(1,2))

matplot(t(chiStM),type="l")
matplot(t(chiPM),type="l")
par(mfcol=c(1,1))