ケース・コントロール用ハプロタイプデータのシミュレーション生成に関して盛り込むパラメタ



Coalescent, recombination, diffusion, 変異のselection力, 人口増減, recombination rateのばらつきを盛り込んで、疾患責任変異とその周辺ハプロタイプをシミュレートし、そのハプロタイプに対して、phenocopy, 低penetranceを考慮して、ケース・コントロール関連解析の検出力などを検討した論文

プログラム名「GeneArtisan」

  • 論文の内容の質は別として、Population genetics 的観点から、どんな要素を盛り込んでシミュレーショナルハプロタイプデータを作成するべきかについてまとめるのには網羅的でよい印象を受けた

  • 集団ハプロタイプをシミュレートするためのパラメタとモデルのリスト

  • パラメタ
    • nD and nN : ケース・コントロール人数
    • N0 : 現在の人口
    • r : 指数関数的人口増加モデルにおける人口増加率(指数)
    • T' : 疾患感受性アレルの発生時期(世代)(過去にさかのぼる)
    • p : 疾患感受性アレルの集団内頻度(世代の(離散的)関数)
    • E(p) : 疾患感受性アレルの集団内頻度の期待値(現在時?)
    • θ(.) : マーカー位置
    • s : Selection(淘汰)係数
  • モデル
    • Ancestral Recombination Graph(ARG)(参考図 参照)を作成するときのモデル
      • 指数関数的人口増加モデル
        • 他の人口増減モデルの組み込みも可能。世代別離散的総人口を与えればよい
      • Coalescent-recombinationモデル
        • CoalescentとRecombinationの発生制約(疾患感受性変異の発生後に制約あり)
          • 疾患感受性アレルの「Ancestor」を一意に決めるために、世代T'において疾患感受性変異が1コピー発生する(疾患感受性Ancestorとでも呼ぼう)T'からの破線が指す部分
          • T'より現在に近い世代において、すべての疾患感受性染色体は疾患感受性Ancestorからの下流にのみ存在する
          • 世代T'より現在に近い期間において、Coalescentは疾患感受性Ancestor側とそうでない側の内部では観測できるが、その2亜群をまたがってCoalescentは認めない
          • 世代T'より現在に近い期間において、Recombinationは疾患感受性Ancestor側とそうでない側の内部でも観測できるし、両亜群間においても観察できる
        • Coalescent/Recombinationが起きるまでの「待ち時間」
          • discrete-timeモデル(世代を1単位)
            • これと対比されるモデルにcontinuous-time modelがある
          • recursion strategyによる方法を採った
            • 詳細は以下文献を参照せよ

no title

GBM(geometric Brownian model)※



  • Log-normal growthとも呼ばれる
  • 特徴
    • Rateがランダムである
    • ランダムではあるが、ランダム加減の程度は「現在のrate」に比例する
    • Recombination rateのをある染色体の場所におけるrecombination rateとのlog ratio で表したとき、その2点間の物理距離と相関した平均・分散で定義される正規分布になる
      • Recombination rateの実データとの適合性があることが示されている