確率密度関数同士の内積

  • 標本から確率変数の分布を推定することがある
  • パラメトリックな推定では分布の型を決め、その型を表すパラメタの最尤推定などを行って特定の分布であると推定する
  • ノンパラメトリックな推定の一つにカーネル法がある。あるローカルな確率密度は、その知りたい位置の近くに観測された標本の情報を使って推定する。どのくらい近いときにどのくらい重みを置くかを決めるのが、この場合のカーネル関数
  • ローカル情報の使い方を決めるのがカーネル関数
  • それを用いて分布関数がわかったとしたら、その確率密度で重みづけをして\int P(x) Q(x) dxという値を求めることができる。これは二つの確率密度分布の内積
  • P(x),Q(x)が正確に知られていないとき、\frac{1}{NM}\sum_{i=1}^N \sum_{j=1}^M u_i v_j K(x(p)_i,x(q)_j)のようにして、\int P(x) Q(x) dxの推定値としようというのがカーネル法
  • 標本同志の遠近関係をカーネル関数で計算することで、異なる位置x(p)_i,x(q)_jに、片や重みu_i、片やv_jで標本があるときに、内積を離散的な二重積分和のようなものにしている