第6限 確率・確率密度・尤度・ベイズの定理(推定統計) 遺伝統計学のための統計学基礎



  • Probability(確率)
    • 何かを観測する場合を想定している
    • 観測するとき、標本とその観測値とが得られる
    • 観測値が離散的(サイコロの目が、1,2,3,4,5,6の6通りであるような場合)な場合には、それぞれの観測値(目の数)について、その目が出る確率がある(きちんとしたサイコロならその値は¥frac{1}{6})
    • 観測値が連続的(身長測定など。測定精度の限界を無視すれば、無限に細かい長さを測定しうる)な場合には、ある長さからある長さまでの間の値が測定される確率がある。確率は0以上、1以下である
    • 標本を取り出す元となる母集団の分布と、観測に伴う誤差などから、観測を繰り返すと観測値は分布をとる
    • 母集団の分布を観測により推定するときには、観測値の分布から、母集団の分布を推定することになる
  • Probability density(確率密度)とProbability density function(確率密度関数)
    • 参考サイト
    • その観測値はいくつか(いくつも)とりえるが、観測される値は1つである
    • すべての観測値についての確率を足し合わせると、その総和は1になる(添付図の水色の部分の面積が1であるということ)
    • ある値からある値までの間の観測値を得る確率は、確率密度分布の部分定積分になる(この記事の添付図のピンク色の部分の面積に相当)。全体の面積が1だから、この部分定積分は0以上1以下である
  • 尤度(likelihood)
    • ある観測データがある。ある仮説がある。ある仮説のもとで、その観測データが得られる確率が計算できる。この「仮説が観測データをもたらす確率」が尤度である
  • やや数学的な記載はこちらこちらの記事で
  • ベイズの定理
    • 条件付き確率に関する定理
      • だれかがサイコロを1回振ったと聞いた。4の目が出た確率はどのくらいかと問われたら、¥frac{1}{6}が答え。この分母は1-6のすべての場合の6である
      • 今、その目は「偶数だった」との情報が入った。すると、4の目が出た確率はという質問への答えは¥frac{1}{3}。この分母は2,4,6という偶数の場合の数である
      • この「偶数だった」との情報を得た後の確率¥frac{1}{3}が条件付き確率である
      • この条件は複雑になるかもしれない。しかしながら、計算可能であり、ある仮説の下である観測データが得られる条件付き確率(尤度)として算出し尤度比検定を行ったり、MCMC法などで条件付き確率のもとでシミュレーションを行ったりする場合に盛んに計算される