1倍体を単位として計算量を減らすアプローチ

  • 概要
    • ハプロタイプグラフ
      • 家系図(2倍体の伝達関係)から1倍体の伝達の様子(ハプロタイプグラフ)を作る
      • 家系図はすべての個人がつながっているが、ハプロタイプグラフはつながっていない
      • 母方と父方のグラフに分かれる
      • 「子はかすがい」
        • 「子が産まれると母方・父方のハプロタイプグラフが子を介して連結する」
    • 場合分け
      • 伝達パターンで場合分け
        • 親が子にアレルを伝えるときに、そのアレルが、その親の母方のものか父方のものかの場合わけ
        • こうすると、「枝分かれ」の無い、木グラフになっている
      • 母方・父方アレルに振り分ける場合分け
        • 2倍体のジェノタイプ(アレル2本分の情報)を母方アレル・父方アレルに振り分ける
    • メンデルチェック
      • アレルの伝達パターンとして確定したものが得られており
      • 父方・母方の伝達アレルも確定して考えているから
      • そのような伝達パターン・父母パターンが起こり得るかどうかの確認はとれる
        • 木グラフ上のすべてのアレルが同一であれば、「起こり得る」ことで、それ以外は「起こり得ない」こと
    • 木の観測確率
      • すべての木は、一つの「祖先染色体」を持つ
      • 「祖先染色体」は、「集団からの直接の子」の染色体である
      • 「祖先染色体」があるアレルを持つ確率は、(HWEを仮定すれば)集団のアレル頻度に等しいので、それが確率
      • この集団のアレル頻度と、「場合分けされた木の確率(これは、伝達分岐・父母パターンの割り付けが作る確率なので、\frac{1}{2^k}の形をしている
      • したがって、木の観測確率は、アレル頻度と\frac{1}{2^k}とでできている
    • ハプロタイプグラフ全体の観測確率
      • ハプロタイプグラフは、複数の連結グラフでできているから、個々の連結グラフを場合分けをにより、木グラフにしたうえで、確率を計算し、すべての連結グラフ(木)での確率の積をとり
      • それをすべての場合について足し合わせる
  • ソースはこちら