- こちらとその前の日にとある論文での「2つの非独立統計量の和をガンマ分布でp値化する話」にまつわることをやっている
- 自由度2の観察空間を考える
- 2つの自由度1の検定を単位ベクトルで表現する
- 2つの検定の非独立の程度は、単位ベクトルのなす角で表すことにする
- この観察空間では、期待点を原点として、自由度2の正規分布が観察される
- 2つの自由度1の検定をカイ二乗統計量で行えば、その統計量の期待値は自由度に等しいから、1
- 2つの自由度1の検定統計量の和を、「合わせた統計量」とすれば、その期待値は、2つの自由度1検定が独立であっても非独立であっても、1+1=2
- 他方、2つの検定がまったく同一であれば、その自由度は1、まったく独立であれば、自由度は2
- 2つの統計量の和である「合わせた統計量」の等高線が楕円になることは、昨日示した通り
- また、「合わせた統計量」の分布がガンマ分布に似ている(合致するのかもしれない(するような気がする)かどうかは引用文献のそのまた引用文献に戻らなくてはならないが、読んでないので、ここでは、どちらかだとしよう)
- 今、ガンマ分布は、期待値と分散とを定めると、ガンマ分布を決める2つのパラメタが決まってしまうような分布(パラメタの個数が2個の分布)
- 期待値は2つの自由度1検定の非独立度によらず2なのだから、ガンマ分布の2つのパラメタを決める作業は「1変数推定」に過ぎない…
- 推定してみると、のような関係なのでは…と思われるが
ts <- seq(from=0,to=1,length=10)*pi/2
thetas <- ks <- rep(0,length(ts))
thetas.2 <- 3+cos(2*ts)
ks.2 <- 2/thetas.2
n.pt <- 100000
df <- 2
X <- matrix(rnorm(df*n.pt),ncol=df)
for(tt in 1:length(ts)){
tti <- ts[tt]
v1 <- c(1,0)
v2 <- c(cos(tti),sin(tti))
chi2.1 <- (X%*%v1)^2
chi2.2 <- (X%*%v2)^2
p.1 <- pchisq(chi2.1,df=1,lower.tail=FALSE)
p.2 <- pchisq(chi2.2,df=1,lower.tail=FALSE)
df.2 <- 1
x <- qchisq(p.1,df.2,lower.tail=FALSE)+qchisq(p.2,df.2,lower.tail=FALSE)
m.x <- mean(x)
v.x <- var(x)
theta <- v.x/2
k <- 2/theta
thetas[tt]<-theta
ks[tt]<-k
y <- rgamma(n.pt,scale=theta,shape=k)
xlim <- ylim <- range(c(x,y))
plot(sort(x),sort(y),xlim=xlim,ylim=ylim)
abline(0,1,col=2)
plot(data.frame(p.1,p.2))
}
plot(data.frame(ts,thetas,ks))
plot(thetas, thetas.2)