カーネル推定と特性関数とモーメントとフーリエ変換
- こちらでGaussian Sequence Modelをなぞっている。その一環
- カーネル推定は、積分して1になる関数(カーネル関数)を重みづけ関数として、「元の関数(や観測データ)」を畳みこんで推定値(推定関数)を作成する方法
- カーネル関数は(負の値を持つ場合もあるが)、確率密度関数のようなものである
- 確率密度関数には、積率母関数(moment generating function)がある(場合がある)
- この積率母関数は、確率密度関数そのものと同様に、確率変数をきちんと定義づける関数であるが、そのような性質を持つ関数に特性関数がある
- 確率密度関数にある特性関数はカーネル関数にも定義できる(多分)。そうすると、モーメントの期待値が特性関数のt=0周りの導関数として取り扱える
- カーネル関数がq-th order カーネルというとき、においてとなる性質があり、このようなpが大きいとカーネル関数を用いた畳みこみ計算は楽(収束が速い?)になる。
- このqを知るのに、カーネル関数をフーリエ変換してやると、t=0周りのn階微分値を取り出すことは容易であって、カーネル関数の畳みこみにおける挙動の重要な情報が取り出せる
- これが、カーネル推定と特性関数とモーメントとフーリエ変換・フーリエ展開との関係
- 実際には何をminimax推定するかというと、カーネル関数はのように「hという幅が可変」であり、この値として「最適化」をしたいものであるから、それがminimax推定できる枠組みが得られればよい
- カーネル関数で畳みこんで、それについて台全体に渡って「ずれ」の積分をすることが「リスク関数値」の算出になる
- その計算をするにあたり、テイラー展開をかませると、台の着目値周りにおけるモーメント・導関数が効いてくる。どのくらいのオーダーまで考慮するかで、テイラー展開の精度が影響を受けるが、q-th order関数を用いて、q次まで見てやることにすれば、q-1次までのモーメントが0だから、台全体での積分によって消える(vanishing moments)。残るはq次だけ(それより高い次数は近似という意味合いで省略してある)。結局、ある程度の次数でのテイラー展開という近似をするときに、1,2,...,q次の項のすべてを計算せずに第q次だけの計算でよくなって便利、というのが、q-th orderカーネルの役どころ(らしい)
- このようにして計算が楽になったリスクには、カーネル関数の幅を決めるパラメタ()が登場し、このを小さくすると当てはまりは良くなるが、分散が大きくなる、というminimaxの構図に持ち込まれる