ここはIBD?

  • ある領域について、父親がPA,PB、母親がMA,MBを持つとする
  • 2人の子 C1,C2がいて、その子はC1A,C1B,C2A,C2Bを持つとする
  • C1とC2はこの領域に関してどのようなパターンがあるだろうか?
    • 2アレルとも、IBD: (diplo-)identical
    • 片方がIBDで片方はIBDではない: haplo-identical
      • IBDなのは父由来 : paternal haplo-identical
      • IBDなのは母由来 : maternal haplo-identical
    • 両方ともIBDではない : non-identical
  • 上記4パターンを仮説H2,H1p,H1m,H0と呼ぶことにする
  • それぞれの仮説が親子のジェノタイプを観察する確率を計算するとそれは尤度
  • ある仮説の尤度がほかの仮説の尤度よりも大幅に高ければ、その仮説を信じることは妥当と考えられる
  • さて、尤度は何があれば計算できるだろうか
    • C1,C2のジェノタイプがあるとよい
    • 父母のジェノタイプがあるとよい
    • 父または母もしくは両方のジェノタイプが不明のときには、不明なジェノタイプに推定値(不明者の帰属集団のジェノタイプ頻度がわかっていれば、それを、帰属集団のアレル頻度だけがわかっていれば、HWEを仮定した(もしくはHWDを定めるFixation indexを仮定した)ジェノタイプ頻度を、どちらもわかっていなければ、均等確率でも…)を仮定してやればよい
    • 他に使える情報はないだろうか?
      • 親から子への伝達は、交叉組み換えがおきない限り、染色体上で同じ由来になるルールがある
      • したがって、2人の子が受け継いだ、4本の染色体のすべてについて、交叉・組み換え箇所があるかどうかで、H2,H1p,H1m,H0は交代するはず
      • 交代できるパターンと交代できないパターンももちろんある
      • つまり、1本の染色体全長について、H2,H1p,H1m,H0が作る線分モザイクパターンが、「総合的な仮説」になる
    • 総合的な仮説に照らして、染色体のどの領域がどの仮説になるかの尤度がわかる
    • そのほかの留意点としては、尤度の計算では、実験エラーが「ありえない」を出すので、それを救済する仕組みが必要になる