SNPの2値性と集合



  • SNPはカテゴリカルデータ
    • 大多数のSNPは2アレルであるので、カテゴリ数2のカテゴリカルデータとしてとらえることができる。
    • 集団でのアレル頻度がpと1-pとであるようなSNP(A,a)で、アレル(A,a)を観測するという事象の確率はP(A)=p,P(a)=1-pである。
    • SNPが作るハプロタイプは、個々のSNPにおける二者択一の組合せとなる。
    • 集合論的独立性(記事はこちら)の議論が使える。
    • 今、k個のSNPからなるハプロタイプがあるとき、2^k個の異なるハプロタイプが存在しうる。
  • SNPのアレル観測の独立性
    • k個のSNPのアレル選択という二者択一が「集合全体として独立」であるとき、k個のSNPから任意に選んだ、m個(m ¥le k)のSNPは、m個の「個別SNPへの分割について独立」である。

    • 2SNPの例
      • SNPA(A,a),SNPB(B,b)がある。
      • 連鎖平衡においては、次の4式が成り立つ。
        • P(AB)=P(A)P(B)
        • P(Ab)=P(A)P(b)
        • P(aB)=P(a)P(B)
        • P(ab)=P(a)P(b)
      • ペアワイズ連鎖不平衡係数
        • 上記の4つの式が成り立つとき、P(AB)P(ab)-P(Ab)P(aB)=0が成り立つので、ペアワイズ連鎖不平衡係数では、この値がゼロであることをもって、連鎖平衡にあることを示すことにしている。
    • 3SNPの例
      • SNPA(A,a),SNPB(B,b),SNPC(C,c)がある。
        • それぞれのアレル頻度をP(A),P(a)=1-P(A),P(B),P(b)=1-P(B),P(C),P(c)=1-P(C)とする。
      • 3通りのSNPペア、A-B,A-C,B-Cがある。
        • ペアA-Bについて上述の2SNPでの独立の記述が成立する
        • 残りの2つのペアについても、第1第2のSNPを入れ替えることによって、同様のことが言える。
      • 3個のSNPの組合せは1つである。
        • ハプロタイプABC,ABc,AbC,AbC,aBC,aBc,abC,abcがある。
        • それぞれのハプロタイプ頻度をP(ABC),P(ABc),P(AbC),P(Abc),P(aBC),P(aBc),P(abC),P(abc)とする。
        • 3通りのSNPペアのアレル観測がいずれも独立であるとき、必ずしも3SNPのアレル観測は独立ではない。

          • P(ABC)=0.25
          • P(ABc)=0
          • P(AbC)=0
          • P(Abc)=0.25
          • P(aBC)=0
          • P(aBc)=0.25
          • P(abC)=0.25
          • P(abc)=0
          • このとき、3個のSNPペアはそれぞれ独立である。
            • P(A)=P(a)=P(B)=P(b)=P(C)=P(c)=0.5
            • P(AB)=P(Ab)=P(aB)=P(ab)=0.25
            • P(AC)=P(Ac)=P(aC)=P(ac)=0.25
            • P(BC)=P(Bc)=P(bC)=P(bc)=0.25が成り立っていることから確かめられる。
          • 3個のSNPの組合せが3個の「個別SNPへの分割について独立」であるとすると、次の式が成り立つはずであるが、この例では成立していない。
            • P(ABC)=P(A)P(B)P(C)
              • 実測では不成立(以下同様)0.25 ¥ne 0.125
            • P(ABc)=P(A)P(B)P(c)
              • 0 ¥ne 0.125
            • P(AbC)=P(A)P(b)P(C)
              • 0 ¥ne 0.125
            • P(Abc)=P(A)P(b)P(c)
              • 0.25 ¥ne 0.125
            • P(aBC)=P(a)P(B)P(C)
              • 0 ¥ne 0.125
            • P(aBc)=P(a)P(B)P(c)
              • 0.25 ¥ne 0.125
            • P(abC)=P(a)P(b)P(C)
              • 0.25 ¥ne 0.125
            • P(abc)=P(a)P(b)P(c)
              • 0 ¥ne 0.125