偏微分(駆け足で読む統計学のための数学入門30講 25 26)


微分は1変数において定義されている。偏微分はその多変数への拡張である。1変数における「意味」を「2次元空間上への関数のプロットとその傾きと面積」とすれば、『n多変数への拡張』とは「n+1次元空間への関数のプロットとその減次元空間における傾きとk>=3次元体積」である。

  • 偏微分関数は¥frac{¥partial z}{¥partial x}, ¥frac{¥partial f}{¥partial x}(x,y), f_x{x,y), fxなどと書く
  • p個の多変数による累積分布関数(同時累積分布関数)がF(¥bf{x}), ¥bf{x}=¥{x_1,x_2,¥cdots,x_p}とあらわされ、¥bf{x}のすべての要素について偏微分可能であれば、その同時確率密度関数f(¥bf{x})=¥frac{¥partial^p F}{¥prod_{i=1}^{p}¥partial x_i}(¥bf{x)となる
  • この同時確率密度関数の対数をとると、対数尤度関数となり、それを、変数で偏微分の値がゼロとしたp個の方程式が対数尤度方程式であり、それらを満足する変数の値のセットが対数尤度関数の極大(小)値を与えることから、最尤推定はこのp次対数尤度方程式を解くことからも求められる。ただし、1変数の場合に対数尤度方程式を解くことは、極大値か極小値のいずれかを求めることであったが、多変数の場合には、『すべての変数について極大』であるか『すべての変数について極小』である場合には、多変数関数として『極大(もしくは)極小』となるものの、『一部の変数で極大、一部の変数で極小』であるとき、それは、『鞍点(峠みたいなところ)』であって、極大でも極小でもない(極値の判定については、後述)
  • 合成関数の微分。1次関数とその微分で成立した合成関数の微分y=f{z},z=f(x),¥frac{dy}{dx}=¥frac{dy}{dz}¥frac{dz}{dz}=f’(z)g’(x)が多次元関数とその偏微分でも成り立つ。合成関数x=¥phi(¥bf{w}),y=¥psi(¥bf{w}),z=f(x,y)=f(¥phi(¥bf{w}),¥bf(¥psi(¥bf{w}))につき、¥frac{¥partial f}{¥partial w_i}(x,y)=¥frac{¥partial f}{¥partial w_i}(¥phi(¥bf{w}),¥psi(¥bf{w}))=¥frac{¥partial f}{¥partial x}(x,y)¥frac{¥partial ¥phi}{¥partial w_i}(¥bf{w})+¥frac{¥partial f}{¥partial y}(x,y)¥frac{¥partial ¥phi}{¥partial w_i}(¥bf{w})
  • 1次関数で成り立ったテイラーの公式も同様に多次元関数でも成り立つ。ただし、n次微分の項の数は、変数の組み合わせを考慮する必要がある(x,yの2変数のときの2次の項は¥frac{¥partial^2}{¥partial x^2},¥frac{¥partial^2}{¥partial y^2},¥frac{¥partial^2}{¥partial x ¥partial y}の3通りである)
    • 多変数のテイラーの公式は、偏微分を成分とする行列である「ヘッセ行列」を用いて次のように表せる(2変数の場合を示す)
      • f(x,y)=f(a,b)+(f_x(a,b),f_y(a,b))¥begin{pmatrix}x-a¥¥y-b¥end{pmatrix} + ¥frac{1}{2}(x-a,y-b)¥begin{pmatrix}f_{xx}(a,b)&f_{xy}(a,b)¥¥f_{xy}(a,b)&f_{yy}(a,b)¥end{pmatrix}¥begin{pmatrix}x-a¥¥y-b¥end{pmatrix} + R_3(x,y),ただしR_3(x,y)は3次以上の剰余項。¥begin{pmatrix}f_{xx}(a,b)&f_{xy}(a,b)¥¥f_{xy}(a,b)&f_{yy}(a,b)¥end{pmatrix}をヘッセ行列と言う
  • 極値の判定
    • ヘッセ行列の固有値がすべて負なら(a,b)で極大
    • ヘッセ行列の固有値がすべて正なら(a,b)で極小
    • ヘッセ行列の固有値が正負混在なら(a,b)で鞍点
  • 多変量解析にて回帰式の係数を求めることは、係数を変数としてその最小値を求めることであり、偏微分してゼロと置いた方程式を解き、それが極小になっていることを確認する