かいつまむこと

  • こちらでたくさんの値を一括して観察したときに、個々の観察について推定する話の1つをやっている(まだ読み終わっていないけれど)
  • 要するに、「たくさんの値を観察」して、それらが「全くの無縁であるわけではない」ときに、「一緒に観察した値を反映」させて「個別推定」すると、「ばらばらに推定」するよりも、「トータルでは外れにくい」という話
  • この枠で、多くの方法を語ることができる
  • 点推定。n個の値から1個の平均値を推定しているとき、それは、n個の観察のすべての推定値を1つの共通の値として推定しよう、という方法
  • 同じく点推定。平均値と分散との2つの統計量を取り出す時、それは、n個の観察が平均と分散で指定されるある分布に近似している。この場合は、個々の観察がどういう値を背後に真の値として持っているのかについては、何も言っていないが、「n個の値」から「2個の何か」を確定して、それ以外は「ゴミとして捨てる」という戦略をとることで、全体としての「よさ」を取り出している
  • ヒストグラム。これは、適当なビンの幅を選ぶことで、n個の値をそのビンの真ん中の値とみなしてしまおう、という処理と言えなくもない。そして、それをするにあたっては、矩形波関数で畳み込みしているという風に見える
  • すべての値について、その背後の真値を観察値そのものとすることもできる。これは、ヒストグラムのビン幅を無限小にしていることに相当し、矩形波デルタ関数になっている
  • カーネル分布推定は、矩形波の代わりに何かしら、それなりな関数を使って畳み込んでいるという違いしかない
  • フーリエ変換で、意味のある周波数を取り出すというのは、全観察を復元できるスペクトル全体のうち、意味の大きい方を取り出して、それ以外を捨てて、値を滑らかにしている。n個の値からn-k個の値のみにして、それを用いて観察値の背後の真値の推定値を決めている。また、フーリエ変換も畳み込みと同じような処理であることはその定義式を見ればわかる。フーリエ変換では、度数分布やカーネル分布推定でビン幅が固定・畳み込みの関数が固定であるのと同様に、観測値全体に対して画一的な処理をかぶせている。
  • ウェーブレット変換というのもある。これは、フーリエ変換のようにスペクトル分解するが、フーリエ変換と違って、観測値の存在場所ごとに加減した関数をかぶせた畳み込みのような形。度数分布・カーネル分布推定で言えば、まばらなところのビン幅は広く、密なところのビン幅は狭くすることに(多分)対応するだろう
  • James-Stein推定とかは、個々の観測値に対して推定値を与える方法で、その上で全体のずれが小さくなることを考えた手法であり、そこでも、n個の値からn個の値を推定するにあたって、どうやって、情報を捨ててやるか、という視点で眺めることができる