第5限 期待値(推定統計) 遺伝統計学のための統計学基礎



  • やはり「平均値」は一番知りたいこと
    • 要約統計量の記事(こちら)で、分布を特徴づける統計量にはいろいろあることを示したし、平均値のほかにも、最頻値や中央値といった平均値をりもある意味で「代表値」としてふさわしい統計量があることもわかっている。しかしながら、「平均値」はやはり特別である。それは、ある事象が繰り返し観測されたときの「平均値」はその事象の「期待値」の推定値となっているからである。
    • 「期待値」の推定値とは
      • ある事象の「期待値」とは、いろいろな値をとることが確率的に決まっている事象(確率変数)が1回起きるときに、得られると「期待」される値を「確率変数の値」x「確率」の積分で定義されている
      • この「期待値」の「真の値」は確率密度関数に対して定まっているが、その確率密度関数も期待値も知りえないときには、観測データから推測する対象となる
      • 「期待値」を推定するとき、複数の観測を繰り返してやると、「期待値」を「複数の観測の平均値」であると推定してよい。この関係があるから、「平均値」は一番知りたいこととなる
    • では、確率変数についての推定にとって、他の要約統計量は平均値ほどには、重要ではないのだろうか
      • たとえば、観測データの最頻値
        • 最頻値は、ある事象を1回観測するときに、もっとも高い確率で起きる値である。したがって、その値の「期待値」を推定することも重要である。しかしながら、「最頻値」の「期待値」は、確率変数の期待値とは異なる点がある。「最頻値」は、複数回の試行をしたときに得られる「代表値」であるから、「最頻値」の「期待値」を推定するためには、「N回の試行」をM回繰り返し、M個の最頻値を観測した上で、その平均値を算出し、それを持って、「N回試行の最頻値の期待値」の推定値と呼ぶことになる。これは、実は「平均値」の「期待値」にも同様にあてはまることである。「N回試行の平均値の期待値」は同様にM個の平均値を観測した上で、その平均値を算出し、それを持って、「N回試行の平均値の期待値」の推定値と呼ぶことになる。前項では「平均値が『確率変数の期待値(平均値の期待値ではない』の推定値である」と述べていることとの差に留意する
      • この違いはあくまでも、「期待値」が「確率変数の期待値は確率密度関数積分」として定義され、積分の持つ数学的諸性質を持つ特別なものであることと関係する(と思う)。また、標本集団の平均と母集団の不偏平均は一致するのに、標本集団の分散と母集団の不偏分散は一致しないこととも関係するような気もするが、自信がない
  • 確率・確率変数・確率密度などが出てきたが、まだ、その説明がなされていない。それらは次回(第6限 (こちら)で)