U統計量

  • あっているかどうか、心もとないメモ
  • Unbiased な統計量の総称的な位置づけとして"U-statistic"と言う用語がある
  • 昨日の記事で書いたMVUB estimatorの考え方と大きく関係する
  • " In probability theory, a measurable function on a probability space is known as a random variable."と可測関数のWiki記事(英)にあるように、確率変数が「可測関数」(確率変数は色々な値を取るが、どの値がどのくらいの確率/確率密度で観察されるかは確率関数・累積確率関数で定義されている。そういう意味で、確率変数は標本空間とその加法関係とのルールの下で実数に対応づく。この実数への対応付けが「関数」であって、その特徴に「可測」がある。ちなみに、実数に対応づく、というところを、実数以外の可測空間への対応付けに拡張しててもよい)。で、可測であるっていうのはどういうことかというと、積分がきちんとできるような空間構造があるということ。それは確率変数・確率分布の場合は累積確率関数がきちんとしているということに相当する。
  • このことが(なんとなくでも)わかると、U-statisticのWiki記事(英)にある、"An estimable parameter is a measurable function of the population's cumulative probability distribution: For example, for every probability distribution, the population median is an estimable parameter. The theory of U-statistics applies to general classes of probability distributions."という説明の意味が取りやすくなる。
  • 確率変数があって、確率変数が決める何かしらの関数について推定するっていうのは、確率変数の累積確率関数によって決まる、というのは、確率変数が可測変数である、という話とのつながりで理解する。
  • さらに、同記事にある"The theory of U-statistics allows a minimum-variance unbiased estimator to be derived from each unbiased estimator of an estimable parameter (alternatively, statistical functional) for large classes of probability distributions."という説明は:確率変数によって決まる何かしらの量を推定したい、しかも、unbiasedに推定したい(確率変数のパラメタをフルに推定することを前提に推定したい)ときに、MVUB estimatorはそういった推定の基本であり、それは「minimum variance」という最善なもの同士を紡いで行えば、最善なまま複雑なそれを作れる、というそういう話になるらしい。
  • そんなこんなで、U-統計量の推定をしたいとき、それをU-統計量にうまく分解してやれば、一気にU-統計量の推定をすることが、何かしらの理由で難しいときでも、分解したU-統計量の推定が一気にやるよりやりやすいなら、それをやって、合成することで、一気にやりにくかったことも、結果としてやりやすい、という話らしい