組換え体を発生する交叉と階層化(個人的メモ)



簡単のために、2アレル多型2ローカスについて考える。00 11というハプロタイプがある。この2ハプロタイプ間で交叉が起きると、組換え体01 もしくは 10が生じる。今、ハプロタイプとして00 01 10 11があったとき、組換え体を生じるハプロタイプのペアは00-11, 01-10の組み合わせに限定される。このようなハプロタイプの組み合わせが接合する確率は、均一ランダムメイティング集団においては、Pr(00)*Pr(11) + Pr(01)*Pr(10)となる。今、連鎖平衡状態に達している2ローカスにおいては、連鎖不平衡係数の分母がゼロとなっているわけだが、この連鎖不平衡係数の分母はPr(00)*Pr(11) - Pr(01)*Pr(10)で表される。この式の「有効な交叉」的視点からの意味は「組換え体を生じる交叉ペアのできかたは2通りあるが、その2通りの出来る確率が同一になっているので、組換え体が新規に生じても、全体としてハプロタイプの頻度は変わらない平衡状態にある」といえる。

このように、組換え体を生じさせるようなハプロタイプの組み合わせができる確率「Pr(00)*Pr(11) + Pr(01)*Pr(10)」であるが、この確率は、ランダムメイティングの行われている集団においては、この式で表される頻度となるが、いくつかの要因が存在し、実在の集団ではこの式で与えられる値に補正をした値になると考えられる。

その要因には

  • 集団階層化
  • 階層化した複数集団ごとのアレル頻度のばらつき
  • 階層化した複数集団内での2ローカスの連鎖不平衡状態

が挙げられる。

このうち、亜集団内に連鎖不平衡がある場合には、その不平衡の具合が亜集団にどのように分布するかによって、上述の確率を上限とし、下限をゼロとするような確率で有効なハプロタイプのメイティングがおきる。

すべての亜集団で連鎖平衡にある場合には、上述の因子を除外できる。

そのような場合には、次のような関係がある。

集団階層化によって、N亜集団に分けられ、亜集団間でメイティングが起きない場合には、¥sum_i^N p_i^2をかけて得られた値を上限とする確率が有効な交叉組み合わせの確率になる。

ただし、この上限値をとるのは、N亜集団すべてにおいて2ローカスのアレル頻度が同一の場合である。亜集団ごとにアレル頻度がばらつく場合には、¥sum_i^N p_i^2をかけて得られた値を上限にしてより小さい確率でしか有効な組み合わせは発生しない。

まとめると


観測ハプロタイプ頻度から、集団の『有効ハプロタイプ組み合わせメイティング確率』の上限が算出できる。
連鎖不平衡にあるローカス間では、最大で『有効ハプロタイプ組み合わせメイティング確率』、最小でゼロの確率で有効組み合わせが発生する
連鎖平衡にあるローカス間(無限遠・異染色体上)では、亜集団の構成頻度によって規定される値によって補正された値を上限とする確率がある。
亜集団のアレル頻度が同一のときにその上限値をとり、不均一になるとゼロに近づく