指数型表現の利点の確認(2)とモーメント

  • A(\mathbf{\theta})とモーメントの関係
  • \frac{dA(\theta)}{d\theta}T(x)の期待値であることを以下に示す
    • A(\mathbf{\theta})f(x|\theta)=\frac{h(x)e^{\theta \cdot T(x)}}{e^{A(\theta)}}と表されることからもわかるように(確率分布の台全体の積分が1であることより)
    • e^{A(\theta)}=\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)} dxであるから
    • A(\theta) = \ln{\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)} dx} という関係にある
      • \int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)} dx = Q(\theta)とおいて微分してやると…
    • \frac{dA(\theta)}{d\theta} = \frac{1}{Q(\theta)}\frac{dQ(\theta)}{d\theta}
    • =\frac{\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)} T(x)dx}{\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)} dx}となって、さらに、分母分子にxの関数ではないe^{-A(\theta)}をかけてもよいから
    • =\frac{\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)-A(\theta)} T(x)dx}{\int_{x \in \mathcal{X}} h(x)e^{\theta \cdot T(x)-A(\theta)} dx}となる
    • この分母は、確率密度分布の台全体の積分だから1で、分子は、「T(x)の値をxの確率で重みづけをして足し合わせたもの」なので、T(x)の期待値の定義そのもの
  • 同様に\frac{d^2 A(\theta)}{d\theta^2}E(T^2(x)) - (E(T(x))^2となって、T(x)の分散(xが単変数の場合)
  • 今、T(x)=xであるなら、xの平均と分散が出ることになる
  • たとえば、二項分布のA(\theta) = n \ln{(1+e^{\eta})}であるが(こちらを参照)
    • \frac{d A(\theta=(\eta))}{d\theta=(\eta)} = n\frac{e^\eta}{1+\eta}であって、\eta = \ln{\frac{p}{1-p}}を代入すれば、平均npが確かに得られる。分散も同様
  • 分散を定めない正規分布の場合、T(x)=\begin{pmatrix}x\\ x^2\end{pmatrix}であり、A(\theta)= -\frac{\eta_1^2}{4\eta_2}-\frac{1}{2}\ln{(-2\eta_2)}であるが、これを\eta_1,\eta_2でそれぞれ微分すると、-\frac{\eta_1}{2\eta_2},\frac{1}{4}\frac{\eta_1^2}{\eta_2^2} -\frac{1}{2\eta_2}となって、これを\mu,\sigmaで表せば、\mu,\mu^2+\sigma^2となって、それぞれx,x^2の期待値になっている