兄弟(同胞)の遺伝子はどれくらい似ているか（３） - ryamadaの遺伝学・遺伝統計学メモ

これの続き
- 前回までに、染色体が同長で組み換えがない場合、染色体の長さが不均等で組み換えがない場合について考えた。
- 組み換えを考慮しよう。
はじめに、染色体数が１で、組み換えがある場合を考える
- 同胞が共有する割合の期待値は
  - これは、同胞のそれぞれで任意の位置に組み換えが起きたとして、共有部分の取り方は、同胞のそれぞれの組み換え点間線分が祖父系・祖母系かの決め方により、共有部分となった線分は、祖父系・祖母系の決め方を入れ替えたら、必ず非共有部分となり、あるときに共有されなかった線文は、祖父系・祖母系の決め方を入れ替えたら、必ず共有されることから、わかる
- 分散は、というと、共有線分の数の分布と、その長さの分布によることが予想される。
  - 同長染色体仮定の場合には、長さは均等で、共有線分数が２項分布にしたがっていた。
  - 非同長染色体仮定の場合には、長さは不均等で、共有線分数が、２項分布に従っていた。
- 組み換えを考慮し、染色体数を１とすると
  - 長さは指数分布に従い、共有線分数はポアッソン分布に従うと考えるのは、もっとも雑な、ランダム組み換えモデルである。組み換えの最低数が１、組み換え点は近すぎることはない、などの制約を考慮していない点が、雑、と言う理由である。
    - 共有線分数が $N \sim Poisson(\mu)$
    - 共有線分の長さが $l\sim Exp(\lambda)$
さらに、複数染色体に拡張すれば、それにより、共有線分数の分布と、共有線分の長さの分布がそれなりに表わされる。
- 線分数が与えられると、その線分数の場合で最も分散が小さくなるのは、等長のときであり、組み換えによる長さのばらつきは、等長のとき（長さの分布の分散がゼロ）より必ず大きくなる
指数分布に従う線分長の乱数発生
- $cdf: 1-e^{-\lambda x}$

public static double rexp2(double lambda){
		return(-1/lambda*Math.log(1-Math.random()));
	}