3 SNP CNPのアリル・ディプロタイプ・ジェノタイプ・ハプロタイプ

  • アリル、アリル数(SNPのアリル数 NSa、CNPのアリル数NCa)
    • SNPのアリル
      • SNPのアリルはA,T,G,Cの4塩基のうちのどれかひとつをとる、とり方であるので、最大アリル数は4。
      • アリル数2であることが普通。実験データとしては、アリル数2のSNPのディプロタイプ タイピング手法が主流であるので、アリル数2であるものとして考える。
      • NSa=2
    • CNPのアリル
      • CNPのアリルは、単位配列のコピー数。コピー数は0回から不定回。最少コピー数は0、最多コピー数は不定
      • 最少コピー数がCm,最多コピー数がCMであるとき、アリル数の最大値は、CM-Cm+1。今、Cm以上、CM以下のコピー数のうち、集団に存在しないコピー数アリルがあったとしても、そのコピー数アリルの存在を仮定し、その集団内頻度が0であると考えることにすると、CNPのアリル数は、常に、CM-Cm+1と定めることができる。
      • NCa=CM-Cm+1
    • ハプロタイプのアリル
    • SNP
    • CNP
    • SNPとCNPとの組合せ
  • ジェノタイプ、ジェノタイプ数
    • 2種類のジェノタイプ
      • カテゴリとしての性格による分類
        • 順序なきカテゴリとしてのジェノタイプ
        • 順序ありカテゴリとしてのジェノタイプ
      • 2つの染色体アリルを区別するか否かによる分類
        • ディプロタイプ的ジェノタイプ
        • ディプロタイプ的でないジェノタイプ
        • 由来親(父親・母親)を区別するジェノタイプ(通常は使わない。実験観測も難しいので以降の記述では無視する)
    • ディプロタイプ的ジェノタイプのタイプ数(Ngd)
      • アリル数Na(NSaまたはNCa)から、2つを選択する仕方は、ホモの取りかたはNa、ヘテロのとり方は\frac{Na(Na-1)}{2}。それらを併せて、Ngd=Na+\frac{Na(Na-1)}{2}=\frac{Na(Na+1)}{2}
    • ディプロタイプ的でないジェノタイプ数(Ngc)
      • CNPの場合は、2アリルのコピー数の和とする。SNPの場合は、2アリルの片方のアレルのコピー数の和とする。SNPのアリルは、Cm=0,CM=1とみなせる。
      • 最少のコピー数和は2\times Cm、最多のコピー数和は2\times CM。とりうるすべてのコピー数和ジェノタイプの種類数はNgc=2\times CM - 2\times Cm +1 =2\times(CM-Cm)+1 = 2\times Na-1
    • ディプロタイプ的ジェノタイプとコピー数和ジェノタイプとの関係
      • ディプロタイプ的ジェノタイプが観測されれば、コピー数和ジェノタイプは確定的に定まる
      • コピー数和ジェノタイプが観測されたとき、ディプロタイプ的ジェノタイプは、推測される(2アリル型であることが分かっていれば、確定的に推測される)
      • ディプロタイプ的ジェノタイプ数はコピー数和ジェノタイプ数と同じかより多い
    • カテゴリの順序
      • Ngd、Ngcはカテゴリ数
      • Ngdは順序なし
      • Ngcはコピー数という順序がある
    • SNPの場合、2アリルCNPの場合の特徴
      • Ngd=Ngc→常に順序ありカテゴリとして扱いうる
    • 複合ジェノタイプ、そのジェノタイプ数
      • 複数の多型のジェノタイプの組合せ
        • 多型の数をNs(SNPの場合)、Nc(CNPの場合とする)と、
          • Ngd(SNP)^{Ns}=Ngc(SNP)^{Ns}=3^{Ns}
          • \Pi_{i=1}^{Nc} Ngd(CNP_i)もしくは\Pi_{i=1}^{Nc} Ngc(CNP_i)
  • アリル数、ディプロタイプ的ジェノタイプ数、コピー数和的ジェノタイプ数の関係
アレル数 ディプロタイプ的ジェノタイプ数 コピー数和的ジェノタイプ数
1 1 1
2 3 3
3 6 5
4 10 7
5 15 9
6 21 11
7 28 13
8 36 15
9 45 17
10 55 19
11 66 21

計算用エクセルはこちら(掲載予定)