ARG上の責任ローカスの位置の事前確率・事後確率
- 前提
- ある領域に多型マーカーが存在し、あるフェノタイプの責任ローカスを特定しようとしている
- その多型マーカーの位置情報が得られている
- この領域のマッピングをするにあたって、個人がおり、そのフェノタイプ情報が得られている
- その多型マーカーについてのジェノタイプデータが得られている
- ARGを推定する(ただし、Zollnerらはゲノム上の点におけるARGを推定するので、作成されるのはTree状である)
- フェノタイプ責任ローカスの位置の事前確率と事後確率
- マッピングに共通する事前確率と事後確率
- 事前確率
- ジェノタイプ情報・フェノタイプ情報を知る前に、責任ローカスがある位置に存在するとみなす確率。解析対象領域につきいいよう確率を与えることが多くの場合に妥当だと思われる
- 今、位置をxとして、 と表記することとする
- 事後確率
- ジェノタイプ情報・フェノタイプ情報を知った後に、責任ローカスがある位置に存在するとみなす確率
- 今、ジェノタイプ情報を 、フェノタイプ情報を として、と表記することとする
- 事後確率と事前確率の関係は、次のようになる
- 事前確率
- ARGを用いる場合
- 事前確率と事後確率の関係にARG(この場合は、2分岐木)が仲立ちとなる
- (式1)の右辺の第1要素 はの算出にあたり、ARGごとに計算して総和をとることでARGに仲立ちをさせる
- に責任ローカスがあるという条件に満足するすべてのARG [texT_x] について総和を取る(積分する)
- 式としてはこうなる
- (式3)
- ここで近似を導入して式を簡略化する
- 近似1
- フェノタイプデータがなければ、ARGの形は責任ローカスの位置について何の情報も持たないので
- フェノタイプデータがなければ、ARGの形は責任ローカスの位置について何の情報も持たないので
- 近似2
- ジェノタイプの観測値は、ARGが定まれば、責任ローカスの位置や、個人のフェノタイプ情報に依存しないという仮定(観測多型に責任ローカスそのものが含まれない場合は、複数の責任変異が領域内に存在する場合には、よい近似である(らしい))
- ジェノタイプの観測値は、ARGが定まれば、責任ローカスの位置や、個人のフェノタイプ情報に依存しないという仮定(観測多型に責任ローカスそのものが含まれない場合は、複数の責任変異が領域内に存在する場合には、よい近似である(らしい))
- (式3)に近似1、2を持ち込んで簡略にする
- この近似式は
- 右辺第1要素は位置におけるARGが与えられたときにフェノタイプデータが得られる確率である
- 右辺第2要素はジェノタイプデータが与えられたときに、あるARGが得られる確率である
- この近似式は
- 近似1
- マッピングに共通する事前確率と事後確率