- 帰無仮説が成り立つ仮説検定のp値
- 一様分布。小さいp値も大きいp値も同じくらい頻繁に得られる、同じくらい珍しく得られる
p.null <- runif(10000)
hist(p.null)
- p値の独立・非独立と検定統計量の独立・非独立
- 2つの検定のp値が独立であるということは、片方のp値が小さくても大きくても、もう片方のp値の分布に変化がない
p1.null <- runif(10000)
p2.null <- runif(10000)
plot(p1.null,p2.null,cex= 0.001)
-
- 2つの検定が非独立なときは、片方のp値が小さいときにはもう片方のp値が一様分布ではなく、小さい方に偏っていたり、大きい方に偏っていたり、とにかく一様ではない
- こんな偏り方もある。p1.null,p2.null自体は一様分布だが、両者は独立ではない
p1.null <- runif(10000)
p2.null <- runif(10000)
s.p1.null <- sort(p1.null)
s.p2.null <- sort(p2.null)
s.p2.null.2 <- c(sample(s.p2.null[1:(length(s.p2.null)/2)]),sample(s.p2.null[(length(s.p2.null)/2+1):length(s.p2.null)]))
plot(s.p1.null,s.p2.null.2)
-
- このようなp1,p2が自由度1のカイ自乗統計量から出たものだとすると、カイ自乗統計量同士の非独立な具合はこんな感じ
plot(qchisq(s.p1.null,1),qchisq(s.p2.null.2,1),cex=0.01)
-
- カイ自乗統計量は、「距離の2乗」と言えるような値なので、自由度1のカイ自乗統計量の関係性の深さは角度で表すことができる
- 2つの統計量の独立・非独立(それが表すp値の独立・非独立)の一つの例として次のような2つのカイ自乗統計量を取ることにする
- 2次元正規分布をとるような事象があり、2つのカイ自乗統計量を2つの単位ベクトルとの内積の2乗で定義する。この2つの単位ベクトルのなす角が直角のとき、2つの統計量は独立であり、それ以外のときには、角の大きさに従って非独立の程度が定まる
- 2次元正規分布
X <- matrix(rnorm(10000*2),ncol=2)
mm <- max(abs(X))
plot(X,xlim= c(-mm,mm),ylim=c(-mm,mm))
mm <- max(abs(X))
plot(X,xlim= c(-mm,mm),ylim=c(-mm,mm),cex=0.01)
phi <- pi/6
v1 <- c(cos(-phi/2),sin(-phi/2))
v2 <- c(cos(phi/2),sin(phi/2))
arrows(0,0,v1[1],v1[2],code = 2,col=2,lwd = 3)
arrows(0,0,v2[1],v2[2],code = 2,col=3,lwd = 3)