N次元空間から見たカイ自乗分布の自由度

  • 多次元球、N次元球の復習
    • N次元球とは、N次元(ユークリッド)空間において、ある点からある距離以下の点の集合であり、N次元球の表面は、ある点からある距離の点の集合である。
    • 半径rのN次元球の表面積は、S(N)=2\frac{1}{\Gamma(\frac{N}{2})}\pi^{\frac{N}{2}}r^{N-1}
    • 半径rのN次元球の体積は、V(N)=\frac{r}{N}S(N)
    • 今、次元nと次元m,n \le mの球を考える。
      • 距離rの表面積の比Sratio(n,m)=\frac{S(m)}{S(n)}は、
        • Sratio(n,m)=\frac{\Gamma(\frac{n}{2})}{\Gamma(\frac{m}{2})}\pi^{\frac{m-n}{2}}r^{m-n}
  • 多次元正規確率密度分布とその関連分布である多次元カイ自乗分布
    • 多次元正規確率密度分布を多次元球の観点から考える
    • 1次元の標準正規分布は、N(0,1)〜\frac{1}{\sqrt{2\pi}}exp(-\frac{x^2}{2})
      • この分布は1次元-\infty \le x \le \inftyに定義されている
      • また、自由度1のカイ自乗分布との関係は、Rの関数を用いれば、次のような対応関係にある
dnorm(x)=dchisq(x^2,1)*x
        • ちなみに、カイ自乗分布は、\frac{(\frac{1}{2})^{\frac{N}{2}}}{\Gamma{(\frac{N}{2})}}(x^2)^{\frac{N}{2}-1}e^{-\frac{x^2}{2}}
      • 2次元を考えよう。-\infty \le x_i \le \infty,i=1,2について、その対象性から、原点から等距離にある点には、同確率が与えられる。ただし、原点からの距離は|X|=\sqrt{x_1^2+x_2^2}。したがって、原点からの距離の関数として2次元正規確率密度関数を表すとき、その値は、N(0,1)に、2\pi |X|の重み付けをしたものとなる。この重み付けは、原点からの距離についての重み付けは、2次元球の表面積(円の円周)についての重み付けである。
      • 一般に、N次元での重み付けは、Sratio(1,N)となる。
        • N_{df=N}(0,1)は、N(0,1)\times Sratio(1,N)に比例する
        • 1次元の正規分布と自由度1のカイ自乗分布との関係(上記)を、この多次元正規分布に持ち込むと、自由度Nのカイ自乗分布は、dchisq(x^2,1) \times x \times Sratio(1,N)に比例することとなる。
        • したがって、N次元空間におけるN次元正規分布の確率密度を多次元球の枠で評価し、それをN次元カイ自乗分布に持ちこんだとき、自由度Nのカイ自乗分布(確率密度関数)は、以下のようになる。
          • dchisq(x^2,1) \times \frac{\Gamma(\frac{1}{2})}{\Gamma(\frac{m}{2})}\pi^{\frac{m-1}{2}}x^{m-1}
        • 今、\Gamma(\frac{1}{2})=\sqrt{\pi}dchisq(x^2,1)=\frac{(\frac{1}{2})^{\frac{1}{2}}}{\Gamma{(\frac{1}{2})}}(x^2)^{-\frac{1}{2}}e^{-\frac{1}{2}(x^2)}であることに注意すると、次のように書き換えられる
          • dchisq(x^2,N) \propto \frac{(\frac{1}{2})^{\frac{1}{2}}}{\Gamma{(\frac{1}{2})}}(x^2)^{-\frac{1}{2}}e^{-\frac{1}{2}(x^2)}\frac{\Gamma(\frac{1}{2})}{\Gamma(\frac{m}{2})}\pi^{\frac{m-1}{2}}x^{m-1}
          • 整理して、dchisq(x^2,N) \propto (\frac{1}{2})^{\frac{1}{2}} \pi^{\frac{m-1}{2}}\times \frac{1}{\Gamma(\frac{m}{2})}(x^2)^{(\frac{m}{2}-1)}e^{-\frac{1}{2}(x^2)}
          • この式の(\frac{1}{2})^{\frac{1}{2}} \pi^{\frac{m-1}{2}}以外の部分にの、カイ自乗統計量(x^2)が含まれており、この部分は、いわゆる自由度Nのカイ自乗分布のそれと一致する。この分布は確率密度分布であるから、x^2の全範囲について積分し、その値が1になるようにな補正項が必要であることから、N次元球の観点から導いたN次元カイ自乗分布は、確かに、カイ自乗分布として知られている分布の式表現に一致することが示されたことになる。以下のRの関数は、N次元球の表面積比を1次元正規分布に持ちこんでN次元化し、それをカイ自乗分布化した後、既知のN次元カイ自乗分布と、N次元球経由のそれとの間でx,x^2の値によらない、定数倍の関係が存在していることを確かめるものである
Sratio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*pi^((df2-df1)/2)
pchiRatio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*(1/2)^((df2-df1)/2)
SratioPchiRatioRatio<-function(difdf)Sratio(1,1+difdf)/pchiRatio(1,1+difdf)
plot(dnorm(chi),dchisq(chi^2,1)*chi)
chi<-seq(from=0,to=20,by=0.1)
dnorm(chi)
dchisq(chi,1)
df=2
dchisq(chi,df)

> plot(chi,dnorm(chi)/gamma(2/2)*pi^(2/2)*chi^(2-1))
> plot(chi,dnorm(chi)/gamma(3/2)*pi^(3/2)*chi^(3-1))
> plot(chi,dnorm(chi)/gamma(4/2)*pi^(4/2)*chi^(4-1))
> plot(dnorm(chi),dnorm(chi)/gamma(1/2)*pi^(1/2)*chi^(1-1))
> plot(dnorm(chi),dchisq(chi^2,1)*chi)
> plot(dnorm(chi)/gamma(2/2)*pi^(2/2)*chi^(2-1),dchisq(chi^2,2)*chi)
> plot(dnorm(chi)/gamma(3/2)*pi^(3/2)*chi^(3-1),dchisq(chi^2,3)*chi)
> k=4
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
> k=0.5
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
> k=3
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
> k=10
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
> k=1
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
> k=2
> plot(dnorm(chi)/gamma(k/2)*pi^(k/2)*chi^(k-1),dchisq(chi^2,k)*chi)
dnorm(chi[10])/gamma(ks/2)*pi^(ks/2)*chi[10]^(ks-1)/(dchisq(chi[10]^2,ks)*chi[10])

k=4
dchisq(chi^2,k)*chi/(dnorm(chi)*pi^(k/2)*chi^(k-1)/gamma(k/2))