第6限 確率・確率密度・尤度・ベイズの定理(推定統計) 遺伝統計学のための統計学基礎
- Probability(確率)
- 何かを観測する場合を想定している
- 観測するとき、標本とその観測値とが得られる
- 観測値が離散的(サイコロの目が、1,2,3,4,5,6の6通りであるような場合)な場合には、それぞれの観測値(目の数)について、その目が出る確率がある(きちんとしたサイコロならその値は)
- 観測値が連続的(身長測定など。測定精度の限界を無視すれば、無限に細かい長さを測定しうる)な場合には、ある長さからある長さまでの間の値が測定される確率がある。確率は0以上、1以下である
- 標本を取り出す元となる母集団の分布と、観測に伴う誤差などから、観測を繰り返すと観測値は分布をとる
- 母集団の分布を観測により推定するときには、観測値の分布から、母集団の分布を推定することになる
- Probability density(確率密度)とProbability density function(確率密度関数)
- 尤度(likelihood)
- ある観測データがある。ある仮説がある。ある仮説のもとで、その観測データが得られる確率が計算できる。この「仮説が観測データをもたらす確率」が尤度である
- やや数学的な記載はこちらとこちらの記事で
- ベイズの定理
- 条件付き確率に関する定理
- だれかがサイコロを1回振ったと聞いた。4の目が出た確率はどのくらいかと問われたら、が答え。この分母は1-6のすべての場合の6である
- 今、その目は「偶数だった」との情報が入った。すると、4の目が出た確率はという質問への答えは。この分母は2,4,6という偶数の場合の数である
- この「偶数だった」との情報を得た後の確率が条件付き確率である
- この条件は複雑になるかもしれない。しかしながら、計算可能であり、ある仮説の下である観測データが得られる条件付き確率(尤度)として算出し尤度比検定を行ったり、MCMC法などで条件付き確率のもとでシミュレーションを行ったりする場合に盛んに計算される
- 条件付き確率に関する定理