ホモ接合体とヘテロ接合体、順序を気にする気にしない

  • ここで同胞のIBDを計算している
  • ヒトは2倍体なので、ペアを作る作業が多発する。
  • ペアを作るときにペアの構成要素が同じか違うかは、組み合わせを作るときに問題になる
  • また、ペアを作ったときに、ペアの構成要素の順序を気にするかしないか、も問題になりうる
  • ペアを作る代わりに、トリオ・カルテットと構成要素数を増やすときも同様で、それだと、こちらの話と共通(ここでは、重複させるかさせないか、で分布の名前が異なっている)
  • ハプロタイプも同じこと(こちらハプロタイプを組もうとしている)
    • ハプロタイプは座位の数珠つなぎに関して、各座位でアレルを選ぶ作業。
    • 染色体上の「順序を気にする」から「順列」
    • 各座位のアレルは同じ名前(A,T,G,Cなど)がついていても、本来、異なるものだから、もちろん「重複可能」
  • そしてプロセスの連続を扱っているゲームでは、もちろん、「重複あり」の「順列」が問題になっている(こちら)。
    • ただし、「ゲーム」にはルールがあるので、それが「条件付き」の「重複を許す」「順列」
    • そして、これは「同じものがあるかどうか」の話なので、「重複」を許さないと始まらず、「順序」は気にしない「組み合わせ」の話
  • 難しく考えることも大事だけれど、やわらかい本を「丁寧に読破(自分なりに語りなおせるように)」することも大事。(高校までの)教科書がわかりやすく書いてあるのは、そういうことだと思います。

  • 本質は(少なくとも、理解できる本質は)、簡単に説明できるのではないか、と考えるのも数学的な発想
  • さて、ここの話に戻る
    • 同胞の2人を区別して、その並べ方を問題にすると、「順列」に、同胞2人の並び順を問題にしないと、「組み合わせ」になる、と思います。
    • 4つのディプロタイプ{1/3,1/4,2/3,2/4}を縦軸と横軸にとり、縦横の軸を第1子、第2子のディプロタイプとすると、同胞のディプロタイプの場合の数は、4x4。
    • これは、第1,2子を縦軸と横軸で区別している状態。
    • 同胞の順序を気にしないときは、4x4行列の上三角だけが問題。
    • ペアを作るときに重複を許さなければ、4x4行列の対角成分を含まない、上三角。
    • 重複を許せば、対角成分と、上三角。
    • nxn行列で考えれば、対角成分はn個。対角成分を含まない上三角成分は(n(n-1))/2 (これは、nから2個とる組み合わせの数)。
    • 重複を許す組み合わせは、これの両方なので、n+(n(n-1))/2 = n(n+1))/2。
    • これは、アレル数nの座位のディプロタイプ数の計算式でもあって、ホモがn種類、ヘテロが(n(n-1))/2種類。ホモ・ヘテロを合わせたディプロタイプ種類数は(n(n+1))/2種類。
  • さて、問題は、組み合わせと順序は、要素を袋の中に放り込んだり、1列並べたりする作業で、そこには要素間の関係が盛り込めない。要素間の関係を盛り込みつつ、順序や組み合わせを考える一つの方法が「グラフパターン」の数え上げ。ryamada本の第15章はそういう順序で書いてあります。
  • ついでに言えば(こちらの『一般化』へのコメント)
    • 一般化するとしたら:
    • 集団があって、そこでは、一切の近親交配がないとすると、家系図は、過去に向かって、2倍、2倍と、どんどん大きくなっていきます。
    • そんなことはあり得ないので、集団では、必ず、程度の差はあれ、「親戚同士」が結婚しています。
    • 小さい集団では比較的、近い者同士が、大きい集団では、比較的、遠い者同士が、結婚します。
    • それを家系図グラフで描くと、血縁関係のある結婚は、「ループ」を生みます。
    • 集団の歴史には、このループが大小取り混ぜてたくさんあり、それが、「集団の家系図の本体」なわけですが、その「本体」をパラメタで表して(表せたとして)、そのときに、IBDとかIBSがどうなるか、そのIBDとかIBSを使ってフェノタイプとジェノタイプとの関係をどうやってひもづけることが「うまい方法か」を考えるのが、遺伝統計学の(大きな)一部…