2分岐木ARGのMCMC構築
- 推定過程は着目点をはさんで左右両側で行う
- 変数
- Neutral coalecent and recombination モデルを規定する変数
- 組換え率
- 変異率
- これら2つの率はARG構築過程で不明な変数である
- ある位置におけるARGは2分岐木である(親ハプロタイプは1本)
- あるハプロタイプのその親との関係は、解析対象領域の全範囲のすべてを受け継いでいるか、その範囲に組換えが発生し、「ある位置」を含んだ限定範囲のみを受け継いでいるかのいずれかである
- この「受け継いでいる範囲 」は、ARG構築過程で不明な変数である
- 2分岐木ARGの特徴
- 現時点ハプロタイプn本は「External nodes」と呼び、木の末梢の「先端」にあたる
- Coalecsentにより全部で2n-1ノードからなる木が形成される。Coalescent eventがおきるたびに、ノードのをn+1から順につけていくと、2n-1番のノードがMost recent common ancestorとなる
- これらn+1,...,2n-1ハプロタイプのアレル情報もARG構築過程で不明な変数である
- 木の形態を定義するにあたり、そのほかに必要な情報は、n-1回起きるCoalescent eventsの発生時刻間隔(要素数n-1個の情報) と、ノード間距離(MRCA以外のノードについて、その親との距離)の情報(要素数n-1個の情報) である
- この木の形態を定義する変数もまた、ARG構築過程で不明な変数である
- ARG構築における推定
- 木の形態を定義する を推定するのが、主目的
- その過程で、同時にその他の変数 も推定される
- Neutral coalecent and recombination モデルを規定する変数
- 変数推定の更新過程
- 推定対象変数
- 推定変数セットの更新はMetropolis-Hastingsアルゴリズムを用いる
- 推定対象変数
- Mutation model
- Haplotype probabilities
- Recombination
- 組換え関係をそれぞれの位置に作成する木のすべてに適用することを試みた場合には、尤度がゼロになることもある
- MCMC開始時の木の構造(トポロジーと枝の長さ)
- 作成された木の尤度
- 組換えによってさえぎられることなく受け継いでいる範囲の変数と観測ハプロタイプ以外のハプロタイプのアレル情報とを分離して順次計算する
- [tex:R]については、木のエッジの数だけひとつずつ順番に推定値を決めながら、すべてのエッジについて推定値を推定するに至らせる。その決める順番は、現代に近い側からである。そうすることで、伝達される範囲の必要な値はすでに決まった状況で計算できる
- についても同様に、2n-1個の非観測ハプロタイプについて、ひとつずつ順番に推定アレルを決定し、その決定結果をもって最終的にすべての非観測ハプロタイプの推定値を得る。この場合は、木の根(MRCA)から始めることで、MRCAはその時点で自身のハプロタイプしか存在しないので、それが伝達するべき情報さえ決まっていれば、その他のハプロタイプのアレル情報に依存せずに尤度計算が可能であり、それより子孫側の尤度は祖先側が決まっていれば、その条件に基づいた尤度の計算が可能である
- MCMC updates
- ある木から次の木へ推移する場合には、変更可能な変数(観測ハプロタイプのアレル情報以外:トポロジー、組換え位置、Coalescent時間、アレル、組換え率、変異率)を変化させて評価する
- 2種類の変化をさせる
- Local update
- ノードの周辺の情報を参照しつつ、あるノードにつながるノードに属する変数を変化させる
- Minor rearrangements
- 1つのノードを選び、その周辺につき、ハプロタイプの世代の上下関係は変えずに、ノードの結び方を帰る。もともとcommon ancestorによってひとつらなりだった、ノード間での付け替え
- Major rearrangements
- Minor rearrangementsと違い、もともとcommon ancestorで直接には繋がっていなかったCoalesce関係を挿げ替える
- Reordering of Coalescent events
- 時間軸を無視すれば、トポロジーとしては変えないが、Coalescentの時刻を変えることで、ARGとしての木の構造を変える
- Local update
- Metropolis-Hastingsでupdateが採用されるか否かを決める