1倍体を単位として計算量を減らすアプローチ
- 概要
- ハプロタイプグラフ
- 場合分け
- 伝達パターンで場合分け
- 親が子にアレルを伝えるときに、そのアレルが、その親の母方のものか父方のものかの場合わけ
- こうすると、「枝分かれ」の無い、木グラフになっている
- 母方・父方アレルに振り分ける場合分け
- 2倍体のジェノタイプ(アレル2本分の情報)を母方アレル・父方アレルに振り分ける
- 伝達パターンで場合分け
- メンデルチェック
- アレルの伝達パターンとして確定したものが得られており
- 父方・母方の伝達アレルも確定して考えているから
- そのような伝達パターン・父母パターンが起こり得るかどうかの確認はとれる
- 木グラフ上のすべてのアレルが同一であれば、「起こり得る」ことで、それ以外は「起こり得ない」こと
- 木の観測確率
- すべての木は、一つの「祖先染色体」を持つ
- 「祖先染色体」は、「集団からの直接の子」の染色体である
- 「祖先染色体」があるアレルを持つ確率は、(HWEを仮定すれば)集団のアレル頻度に等しいので、それが確率
- この集団のアレル頻度と、「場合分けされた木の確率(これは、伝達分岐・父母パターンの割り付けが作る確率なので、の形をしている
- したがって、木の観測確率は、アレル頻度ととでできている
- ハプロタイプグラフ全体の観測確率
- ハプロタイプグラフは、複数の連結グラフでできているから、個々の連結グラフを場合分けをにより、木グラフにしたうえで、確率を計算し、すべての連結グラフ(木)での確率の積をとり
- それをすべての場合について足し合わせる
- ソースはこちら