組み換え割合を対称的にパラメタ化する

  • 2座位(M1,M2)間の組み換え割合を\theta_{12}とする
    • これは、この2座位間で組み換えが起きる確率が\theta_{12}で、起きない確率が1-\theta_{12}ということ
    • 最大値は、独立(染色体が違うとか)の場合で、0.5。
    • 最小値は0。
  • この2座位の間に第3の座位Gを置く
    • M1-G間とM2-G間の組み換え割合を\theta_{1G},\theta_{2G}とする。
  • \theta_{12},\theta_{1G},\theta_{2G}の間の関係は
    • \theta_{12}=\theta_{1G}(1-\theta_{2G})+\theta_{2G}(1-\theta_{1G})
    • これは、M1-G間で組み換えがおきたうえで、M2-G間で起きない場合と、M1-G間で起きずに、M2-G間で起きる場合の和です。
  • \theta_{12}が既知のときに、\theta_{1G},\theta_{2G}の値をどのようにとるのがよいか、は、連鎖解析の位置推定の基本です。式があるので、\theta_{1G}をそのまま変数に使って、\theta_{2G}を既知の\theta_{12}とともに表すことはできるけれども、非対象になるので、対称的にパラメタ化したい。
  • \theta_{1G},\theta_{2G}について対称なので、対称にパラメタ化したい。
  • 式変形をして
    • (0.5-\theta_{1G})(0.5-\theta_{2G})=0.25-\theta_{12}/2
    • ここで、0.5-\theta_{1G}=r cos(t) \ge 00.5-\theta_{2G}=r sin(t) \ge 0と置けば(これは反比例グラフの式)、
    • r^2cos(t)sin(t)=r^2\frac{1}{2}sin(2t)=0.25-\thta_{12}/2なので
    • 正負に気をつけて、r=\sqrt{\frac{0.5-\theta_{12}}{sin(2t)}}
    • したがって、以下のようにかけて、tの範囲は、\theta_{iG} \ge 0を満足する範囲である。
      • \theta_{1G}=0.5-\sqrt{\frac{0.5-\theta_{12}}{sin(2t)}} cos(t)
      • \theta_{2G}=0.5-\sqrt{\frac{0.5-\theta_{12}}{sin(2t)}}sin(t)
theta12s<-c(0.01,0.05,0.1,0.2,0.3,0.4,0.45,0.49)
for(i in 1:length(theta12s)){
theta12<-theta12s[i]
x<-seq(from=0,to=1,by=0.0001)
t<-x*pi/2
theta1G<--sqrt((0.5-theta12)/sin(2*t))*cos(t)+0.5
theta2G<--sqrt((0.5-theta12)/sin(2*t))*sin(t)+0.5
range<-which(theta1G>=0 & theta2G>=0)
x<-x[range]
theta1G<-theta1G[range]
theta2G<-theta2G[range]
plot(theta1G,theta2G,xlim=c(0,0.5),ylim=c(0,0.5),type="l")
par(new=T)
}