兄弟(同胞)の遺伝子はどれくらい似ているか(3)

  • これの続き
    • 前回までに、染色体が同長で組み換えがない場合、染色体の長さが不均等で組み換えがない場合について考えた。
    • 組み換えを考慮しよう。
  • はじめに、染色体数が1で、組み換えがある場合を考える
    • 同胞が共有する割合の期待値はE=\frac{1}{2}
      • これは、同胞のそれぞれで任意の位置に組み換えが起きたとして、共有部分の取り方は、同胞のそれぞれの組み換え点間線分が祖父系・祖母系かの決め方により、共有部分となった線分は、祖父系・祖母系の決め方を入れ替えたら、必ず非共有部分となり、あるときに共有されなかった線文は、祖父系・祖母系の決め方を入れ替えたら、必ず共有されることから、わかる
    • 分散は、というと、共有線分の数の分布と、その長さの分布によることが予想される。
      • 同長染色体仮定の場合には、長さは均等で、共有線分数が2項分布にしたがっていた。
      • 非同長染色体仮定の場合には、長さは不均等で、共有線分数が、2項分布に従っていた。
    • 組み換えを考慮し、染色体数を1とすると
      • 長さは指数分布に従い、共有線分数はポアッソン分布に従うと考えるのは、もっとも雑な、ランダム組み換えモデルである。組み換えの最低数が1、組み換え点は近すぎることはない、などの制約を考慮していない点が、雑、と言う理由である。
        • 共有線分数がN \sim Poisson(\mu)
        • 共有線分の長さがl\sim Exp(\lambda)
  • さらに、複数染色体に拡張すれば、それにより、共有線分数の分布と、共有線分の長さの分布がそれなりに表わされる。
    • 線分数が与えられると、その線分数の場合で最も分散が小さくなるのは、等長のときであり、組み換えによる長さのばらつきは、等長のとき(長さの分布の分散がゼロ)より必ず大きくなる
  • 指数分布に従う線分長の乱数発生
    • cdf: 1-e^{-\lambda x}
public static double rexp2(double lambda){
		return(-1/lambda*Math.log(1-Math.random()));
	}