シミュレーション

  • k個のSNPがあったとする
    • SNPiのアレル頻度を、m_i,M_iとする
    • 0\le m_i\le M_i\le 1とする
    • k個のSNPの順序を0\le m_1\le m_2 \le ... \le m_k \le M_k \le ... \le M_1 \le 1にて決めることとする
  • このとき、次のようなハプロタイプ頻度セットは、全SNPのアレル頻度の条件を満足する
    • h_1:00...0=m_1
    • h_2:10...0=m_2-m_1
    • h_3:110...0=m_3-m_2
    • h_i:111..1100...0=m_{i+1}-m_i
    • h_k:11...10=m_{k}-m_{k-1}
    • h_{k+1}:11...11=1-m_{k}=M_{k}
  • k個のSNPが作りうる、2^k種類のハプロタイプをk+1群に分ける
    • SNPのメジャーアレルの保有数により、0からk個に分類できるので、このk+1群(i=0,1,...,k)に分ける
    • それぞれの群には、\;_kC_i種類のハプロタイプが属する
    • 第i群の第j番目のハプロタイプh_{i,j}と書くことにする。ただし、i=0,1,...,k; j=1,2,...,_kC_i
    • ここで、i群のハプロタイプ頻度の和をq_i=\sum_{j=1}^{_kC_i}h_{i,j}とする
  • 相補的ハプロタイプという関係を確認する
    • 今、001010110101とは、アレルを逆転させているが、このようなハプロタイプのペアは必ず存在し、またただひとつ存在する。このような関係を、相互に相補的なハプロタイプと呼ぶことにし、\hat{h_{i,j}}
  • このようなとき、次のような条件を満足させることで、個々のSNPのアレル頻度を変化させることなく、ハプロタイプ頻度を変化させることができる
    • h_{i,j}=\frac{1}{_kC_i}q_i + \delta_{h_{i,j}}
    • \sum_{j=1}^{_kC_i}\delta_{i,j}=0
    • \delta_{h_{i,j}}=\delta_{\hat{h_{i,j}}}