0と1ばかりの分割表

  • N行M列の分割表があるとする
  • M \ge Nとする
  • M= kN +n, k =1,2,...; 0 \le n < Nとする
  • Mはサンプル数でもある
  • このとき、この分割表のピアソンのカイ二乗値は
  • \sum_{i}^N \sum_{j}^M \frac{(n_{ij}-e_{ij})^2}{e_{ij}}とも書ける
  • これは\sum_{i}^N \sum_{j}^M \frac{n_{ij}^2}{e_{ij}}-Mとも書ける。疎な表(0が多い)ときはこの式は加算する項の数が少なくて便利
    • \sum_{i,j} \frac{(n_{ij}-e_{ij})^2}{e_{ij}} = \sum_{i,j}( \frac{n_{ij}^2}{e_{ij}}-2\frac{n_{ij}e_{ij}}{e_{ij}} + \frac{e_{ij}^2}{e_{ij}})=\sum_{i,j} \frac{n_{ij}^2}{e_{ij}} -\sum_{i,j} 2n_{ij} +\sum_{i,j} e_{ij} = \sum_{i,j} \frac{n_{ij}^2}{e_{ij}} -2\times M + M
  • 次のような分割表を対象とする
    • 列の和はすべて1
    • 行の和はk+1の行がn行、kの行がN-n
    • それぞれの行の期待値は\frac{k+1}{M}\frac{k}{M}
    • セルの値が1であるセルの数は、それぞれn\times (k+1)(N-n)\times k
  • このときN\times M - M=(N-1)\times Mと書ける
    • なぜなら\sum_{i,j}\frac{n_{ij}^2}{e_{ij}}=n\times (k+1) \times 1/\frac{k+1}{M}+(N-n)\times k\times 1/\frac{k}{M} - M=n\times M + (N-n)\times M -M = (N-1)\times M
  • 特にN=MのときはN(N-1)N=M=2のときはN
Nt<-10
for(i in 1:Nt){
	N<-rpois(1,10)
k<-rpois(1,10)
n<-sample(N,1)
M<-k*N+n
M
NM<-matrix(0,N,M)
NM
counter<-0
for(i in 1:M){
	counter<-counter+1
	NM[counter,i]<-1

	if(counter==N){
		counter<-0
	}
}
NM
#sum(NM)=Mを確認
print("=============")
print(sum(NM)-M)

m1<-apply(NM,1,sum)
m2<-apply(NM,2,sum)
E<-m1%*%t(m2)/M
print("------")
print(sum(NM^2/E)-M)
print(sum((NM-E)^2/E))
print(N*M-M)
}