ARG上の責任ローカスの位置の事前確率・事後確率



Zollner et al(2005)の例

  • 前提
    • ある領域に多型マーカーが存在し、あるフェノタイプの責任ローカスを特定しようとしている
    • その多型マーカーの位置情報が得られている
    • この領域のマッピングをするにあたって、個人がおり、そのフェノタイプ情報が得られている
    • その多型マーカーについてのジェノタイプデータが得られている
    • ARGを推定する(ただし、Zollnerらはゲノム上の点におけるARGを推定するので、作成されるのはTree状である)
  • フェノタイプ責任ローカスの位置の事前確率と事後確率
    • マッピングに共通する事前確率と事後確率
      • 事前確率
        • ジェノタイプ情報・フェノタイプ情報を知る前に、責任ローカスがある位置に存在するとみなす確率。解析対象領域につきいいよう確率を与えることが多くの場合に妥当だと思われる
        • 今、位置をxとして、Pr(x) と表記することとする
      • 事後確率
        • ジェノタイプ情報・フェノタイプ情報を知った後に、責任ローカスがある位置に存在するとみなす確率
        • 今、ジェノタイプ情報を G、フェノタイプ情報を ¥Phi として、Pr(x|¥Phi,G)と表記することとする
        • 事後確率と事前確率の関係は、次のようになる
          • 責任ローカスがある位置に存在するという事後確率は、責任ローカスがその位置に存在するという事前確率 Pr(x) と、その位置に責任ローカスがあると仮定した場合に、観測されていつジェノタイプデータとフェノタイプデータが得られる確率 Pr(¥Phi,G|x) との積に比例する
          • 上文を Pr(x|¥Phi,G) ¥propto Pr(¥Phi,G|x)Pr(x) (式1) と表記する
          • 責任ローカスがある位置に存在するという事後確率は位置に関して確率密度分布となるから、上項の比例関係を満たしつつ、あらゆる位置についての定積分¥int_{X}Pr(¥Phi,G|y)Pr(y)dy によって除した値が、事後確率となる
          • この定積分による除算を式で書くとこうなる
            • ¥Large Pr(x|¥Phi,G) = ¥frac{Pr(¥Phi,G|x)Pr(x)}{¥int_{X}Pr(¥Phi,G|y)Pr(y)dy} (式2)
    • ARGを用いる場合
      • 事前確率と事後確率の関係にARG(この場合は、2分岐木)が仲立ちとなる
      • (式1)の右辺の第1要素 Pr(¥Phi,G|x) はの算出にあたり、ARGごとに計算して総和をとることでARGに仲立ちをさせる
      • x に責任ローカスがあるという条件に満足するすべてのARG [texT_x] について総和を取る(積分する)
      • 式としてはこうなる
        • ¥begin{align}& Pr(¥Phi,G|x) &=& ¥int Pr(¥Phi,G|x,T_x)Pr(T_x|x)dT_x ¥¥ & &=& ¥int Pr(¥Phi|x,T_x)Pr(G|¥Phi, x,T_x)Pr(T_x|x)dT_x ¥¥ ¥end{alignat} (式3)
      • ここで近似を導入して式を簡略化する
        • 近似1
          • フェノタイプデータがなければ、ARGの形は責任ローカスの位置について何の情報も持たないので
            • Pr(T_x|x) ¥approx Pr(T_x)
        • 近似2
          • ジェノタイプの観測値は、ARGが定まれば、責任ローカスの位置や、個人のフェノタイプ情報に依存しないという仮定(観測多型に責任ローカスそのものが含まれない場合は、複数の責任変異が領域内に存在する場合には、よい近似である(らしい))
            • Pr(G|¥Phi,x,T_X) ¥approx Pr(G|T_x)
        • (式3)に近似1、2を持ち込んで簡略にする
          • ¥begin{align}& Pr(¥Phi,G|x) &¥approx& ¥int Pr(¥Phi|x,T_x)Pr(G|T_X)Pr(T_x)dT_x ¥¥ & Pr(¥Phi,G|x) &¥approx& ¥int Pr(¥Phi,|x,T_x) Pr(T_x|G)Pr(G)dT_x ¥¥ & &¥propto& ¥int Pr(¥Phi|x, T_x)Pr(T_x|G)dT_x ¥¥ ¥end{align}
          • この近似式は
            • 右辺第1要素は位置xにおけるARGが与えられたときにフェノタイプデータが得られる確率である
            • 右辺第2要素はジェノタイプデータが与えられたときに、あるARGが得られる確率である