- あらすじ
- 独立な2確率変数がガンマ分布に従っているとき、その和もガンマ分布に従うこと、また、和の分布のパラメタは元の2変数のパラメタから計算できることを書いた
- また、2つの一様分布に従う確率変数が相互に非独立であるその関係は千差万別であるが、ある特定の非独立関係を想定した。それは、2つの確率変数がある一つの(2次元)正規乱数を2つの方法で自由度1の検定をしたときのカイ自乗統計量から個々の検定の自由度に応じて算出した2種類のp値分布であった
- このような『特別な非独立関係』は2つの直交しないベクトルが定める
- 相互に直交しない単位ベクトルとの内積の二乗は自由度1のカイ自乗統計量である
- このカイ自乗統計量の和を『和統計量』とすることにする
- この和統計量が描く等高線が楕円となる
- 楕円を等高線とする統計量は、相互に直交する「非単位ベクトル」との内積の二乗を統計量としたときの和としても表せる
- 「非単位ベクトル」が定める統計量は、自由度1のカイ自乗分布(のガンマ分布)のスケールを変えたものなので、のガンマ分布である
- 「非単位ベクトル」が定める統計量はガンマ分布であって、それらは「直交」しているので、和であるガンマ分布のパラメタが算出できる
- 以下に、上述した流れをRを用いて示すこととする
- 非独立であるから楕円
- 2次元正規分布では、原点からの距離の確率は自由度2のカイ自乗分布に従う
- 2つの単位ベクトルのなす角をとし、2つの多にベクトルをとする
- 原点からの距離がの点の2つの統計量は
- の場合のの値との関係をプロットするとつぎのようになり、実際である(それもRで確かめる)
theta <- seq(from=0,to=1,length=100)*2*pi
phi <- pi/6
v <- cos(theta-phi/2)^2 + cos(theta+phi/2)^2
plot(theta,x)
v.2 <- 1+(2*cos(phi/2)^2-1)*cos(2*theta)
plot(v,v.2)
-
- となるようなの値はの関数であり、それは
- これは以下のような楕円になり、この楕円はをによらず通る
theta <- seq(from=0,to=1,length=100)*2*pi
phi <- pi/6
v <- cos(theta-phi/2)^2 + cos(theta+phi/2)^2
plot(theta,v)
v.2 <- 1+(2*cos(phi/2)^2-1)*cos(2*theta)
plot(v,v.2)
r <- 1/sqrt(v.2)
xlim <- ylim <- c(-max(r),max(r))
plot(r*cos(theta),r*sin(theta),xlim=xlim,ylim=ylim,type="l")
abline(h = 1/sqrt(2))
abline(v = 1/sqrt(2))
abline(0,1)
- 楕円を構成する独立な確率分布
- 上述のは、で最大値、で最小値をとり、最大値が、最小値がであるような三角関数である
- このような値は、としても計算できる
- Rで確かめる
theta <- seq(from=0,to=1,length=100)*2*pi
x <- cos(theta)
y <- sin(theta)
v.1 <- 1 + (2*cos(phi/2)^2-1)*cos(2*theta)
v.2 <- 2*cos(phi/2)^2*x^2+2*sin(phi/2)^2*y^2
plot(v.1,v.2)
-
- :この式は楕円の式である
- は独立な二つの統計量の和の式である。また、は2次元正規分布に対して自由度1のカイ自乗分布である。また、自由度1のカイ自乗分布はのガンマ分布である
- の第1項はを倍したものであるから、のガンマ分布であり、第2項も同様にのガンマ分布である
- このことから、「相互に独立な」2つのガンマ分布の和であることが示された
- 非独立な確率変数の和を独立なガンマ分布の和とみなす
- 2つのガンマ分布の和の分布のパラメタは、元の2つのガンマ分布のパラメタから以下のようにして計算できることはすでに示した。
- したがって、
- も同様に計算することができるが、和の分布の期待値は元の分布の期待値の和であり、それは2であり、また、の関係からと計算してもよい
- 和の分布がガンマ分布であって、そのパラメタも正しいことをRを使って確かめてみる
n.pt <- 10000
X <- matrix(rnorm(n.pt*2),ncol=2)
v1 <- c(1,0)
t <- pi/6
v2 <- c(cos(t),sin(t))
s <- X[,1]^2 + (X%*%v2)^2
theta <- 4*(cos(t/2)^4+sin(t/2)^4)
r <- rgamma(n.pt,scale = theta, shape = 2/theta)
xlim <- ylim <- range(c(s,r))
plot(sort(s),sort(r),xlim = xlim, ylim = ylim)
abline(0,1)