第5部 第23章 Inferene, Simulation and Enumeration of GenealogiesHandbook of Statistical Genetics(5-23)

  • 家系図のグラフ表現
    • 一般的な家系図カップルの間に横棒、そこから生まれる子に折れ線
    • Marriage node graph:カップルの成立にノードを与え、その「カップル」関係を作る2親と、その「カップル」関係から生まれる子をノードとして、エッジでつないだグラフ
      • すべての個人間のつながりは、marriage nodeを介する
      • すへてのmarriage node間のつながりは、個人を介する
      • marriage nodeは、そのmarriageを形成する夫婦とその子とによって、nuclear familyを作る
      • nuclear familyは、marriage nodeにおけるマルコフブランケットとなっている
    • モラルグラフ家系図は、非巡回的有向独立グラフである。一般に、非巡回的有向独立グラフにおいては、合流するノードペアの間にエッジを置き、無向にすることで作成するモラルグラフなるものが存在する。
      • モラルグラフは、有向では扱いにくいグラフを、扱いやすい無向グラフにすることで、グラフとして解析することを容易にするという意味がある。
      • また、その取り扱い上の利点の1つであるが、モラルグラフは、ベイジアンネットワークにおいて、その因果推論を支える概念でもあり、その中には、マルコフブランケットと呼ぶ、点集合を定めることができる。マルコフブランケットは、ある点について、自身と、その隣接するノードとからなるノードの集合である。
  • 血縁関係の表現
    • 同胞、いとこ、など、日常語としての血縁関係を表す語があるが、理論的に取り扱うときには、血縁関係を表現する方法が必要である
  • 遺伝的関係の計量
    • IBD
    • 個人のペア
      • inbreeding coefficient
        • ある個人の父由来・母由来遺伝子がIBDである確率
      • kinship coefficient
        • ある個人からランダムに取り出した遺伝子と、もう一人の個人からランダムに取り出した遺伝子とがIBDである確率
      • ある血縁関係に定められるkinship coefficientは、相互に数式で関係が表現できる
    • 個人ペアの同一性の表現
      • 2人が持つ4遺伝子の同一性を、4要素の分割パターン(ベル数、B(4)=15)で表す
  • 染色体に沿っての同一性
    • 組み換えがあるので、染色体に沿って進行するマルコフ連鎖を考え、同一性の変化を起こす。同一性の変化・変更は、junctionと呼ばれ、ポアッソン過程で起きるとされる
    • 特定のkinshipにあるときに、同一状態の変遷をランダム歩行で表現することもできる。そのときに、ランダム歩行の道はkinshipごとに図形で表すこともできるし、推移の状態を行列で表すこともできる
  • 家系の状態空間の状態数の列挙
    • 家系図は、marriage node graphの場合、marriage nodeが表すnuclear familyにおけるマルコフブランケットによって、分離できる。分離することによって、このnuclear familyの母方上界と父方上界とそれぞれの子の下界に分離できる
    • marriage nodeについて、上界の状態数と下界の状態数は、遺伝子の情報に応じて、メンデルの法則を万即するかどうかという制約の下、計算可能である。これを使うと、大きな家系図も逐次処理により、完全に把握することが可能となる
    • これをpeeling methodと呼んでいる
    • モデル化された家系図であれば、状態数は、再帰的に定義でき、それは、行列の累乗を用いて表現でき、状態数の変化をモデル化家系図のサイズの関数としても捉えることが可能になる
  • Marriage node graphもモラルグラフも、マルコフ連鎖の枠組みで取り扱うことが可能で、それぞれ、グラフィカルモデリングにて評価することが可能だったり、グラフ彩色問題を考慮することができたりする