Zollner S et al. (2004)の論文



  • 論文はこちら
  • ソフトウェアTreeLDのダウンロードはこちらから
  • ベイズ
  • ケース・コントロールを併せてARGを構成する
  • Chromosomal sharing backwards in time
    • ARGの複雑なグラフ構造の起源はrecombinationであり、recombinationの影響を受けていない限局された範囲についてのみ考慮すれば、そのDNA線分についてはグラフではなくて木を構築することでARGは完成する
    • したがって、時代を遡るにつれて、より長い線分範囲が木として構築できるようになる
  • MCMCにてARGは成長させる
  • やや詳細
    • 変異アレルは、ワイルドタイプアレルに戻るまで一定頻度で変異イベントを受け付ける
    • 検定P値の補正について
      • Permutation testは、相互に非独立な複数のテストを実行したときに、その非独立性に依存せずにP値を補正できる、有用な方法でLD領域の解析には多用されるが、単純なmultiple testingには使える程度の計算量ではあるが、ARG推定自体が計算量が多く、さらにそのARGに基づいてケース・コントロール関連検定を行うことは計算量をさらに大きくする。そのように1試行のみで多き(過ぎる)計算量の結果得られる統計量をpermutationすることは、非現実的である。したがって、ケース・コントロールの区別をせずにARGを作成し、この部分は、検定以前のプロセスとし、このARGについてケース・コントロール検定をサンプルpermutationをしつつ実行することを提起している。
    • さすがは、Pritchardグループからの論文だけあって、population structureからの影響についてもコメントがあります
    • SNP ascertainment バイアスとrecombination rateの不均一性
      • Mutation については、finite site mutation modelで、一定の変異率を設定
      • Ascertained SNPはアレル頻度が高いものに大きく偏るので、変異率に依存するというよりも、変異の古さに依存するという側面があるが、とりあえず、無考慮でモデルを構築する
    • Phase-unknown diploid dataの扱いについて
      • ARG構築の途中にdiploidデータのphasingも組み込むことは原理的に可能だが、ハプロタイプ型が得られたところからのARG構築のみでも相当の計算負荷となることと、ARG構築とハプロタイプフェージングを並行に行うことと、フェージングを既存の方法にて実施し、それに基づいてARGを推定するのとのどちらがよいかは不明