作ってみる。

HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。
LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。
HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定められる要素と、SNPの組み合わせによって新規に生じる、ヘテロとホモの間の独立からの逸脱として定められる要素とに分解できる。
まず、2SNPのアレル頻度をp_1,p_2とする。
連鎖平衡(LE)の仮定において、4ハプロタイプの頻度はh_1=p_1p_2,h_2=p_1(1-p_2),h_3=(1-p_1)p_2,h_4=(1-p_1)(1-p_2)
このまま、HWEの仮定でジェノタイプ頻度を決めるとすると
g_{11}=h_1^2,g_{12}=2h_1h_2,g_{13}=h_2^2
g_{21}=2h_1h_3,g_{22}=2(h_1h_4+h_2h_3),g_{23}=2h_2h_4
g_{31}=h_3^2,g_{32}=2h_3h_4,g_{33}=h_4^2
連鎖不平衡を導入する。
h_1=p_1p_2+d,h_2=p_1(1-p_2)-d,h_3=(1-p_1)p_2-d,h_4=(1-p_1)(1-p_2)+d
この設定で、2SNPのアレル頻度は影響を受けない。
9ジェノタイプの頻度も
g_{11}=h_1^2,g_{12}=2h_1h_2,g_{13}=h_2^2
g_{21}=2h_1h_3,g_{22}=2(h_1h_4+h_2h_3),g_{23}=2h_2h_4
g_{31}=h_3^2,g_{32}=2h_3h_4,g_{33}=h_4^2
のままとする。このとき、2SNPの3ジェノタイプの頻度はp_i^2,2p_i(1-p_i),(1-p_i)^2のままである。
ここに、SNP1のジェノタイプ分布がHWDにあるとして、その3ジェノタイプがp_1^2+p_1(1-p_1)f_1,2p_1(1-p_1)(1-f_1),(1-p_1)^2+p_1(1-p_1)f_1とする。
9ジェノタイプの頻度を変更しないといけない。次のようにする。
g_{11}=h_1^2+h_1h_2f_1,g_{12}=2h_1h_2(1-f_1),g_{13}=h_2^2+h_1h_2f_1
g_{21}=2h_1h_3+(h_1h_4+h_2h_3)f_1,g_{22}=2(h_1h_4+h_2h_3)(1-f_1),g_{23}=2h_2h_4+(h_1h_4+h_2h_3)f_1
g_{31}=h_3^2+h_3h_4f_1,g_{32}=2h_3h_4(1-f_1),g_{33}=h_4^2+h_3h_4f_1
これにより、個々のSNPの3ジェノタイプ頻度は変わらない。
ハプロタイプの頻度を変える意図はなかったから、変えてはいけない。9ジェノタイプのうち、2重ヘテロのそれ以外は、確定的にハプロタイプの分配パターンが決まるから、f_1を導入したことによって、変化したジェノタイプ頻度において、元のハプロタイプ頻度を実現するためには、2重ヘテロハプロタイプ組み合わせへの分割具合の変更で対応する。この対応が可能である範囲でしかf_1はとれないことになる。
同様に、SNP2のHWDを、f_2を用いて発生させる。
p_2^2+p_2(1-p_2)f_2,2p_2(1-p_2)(1-f_2),(1-p_2)^2+p_2(1-p_2)f_2
g_{11}=h_1^2+h_1h_2f_1+(2h_1h_3+(h_1h_4+h_2h_3)f_1)/2f_2
g_{12}=2h_1h_2(1-f_1)+(h_1h_4+h_2h_3)(1-f_1)f_2
g_{13}=h_2^2+h_1h_2f_1+(2h_2h_4+(h_1h_4+h_2h_3)f_1)/2f_2
g_{21}=(2h_1h_3+(h_1h_4+h_2h_3)f_1)(1-f_2)
g_{22}=2(h_1h_4+h_2h_3)(1-f_1)(1-f_2)
g_{23}=(2h_2h_4+(h_1h_4+h_2h_3)f_1)(1-f_2)
g_{31}=h_3^2+h_3h_4f_1+(2h_1h_3+(h_1h_4+h_2h_3)f_1)/2f_2
g_{32}=2h_3h_4(1-f_1)+(h_1h_4+h_2h_3)(1-f_1)f_2
g_{33}=h_4^2+h_3h_4f_1+(2h_2h_4+(h_1h_4+h_2h_3)f_1)/2f_2
繰り返しになるが、これにより、個々のSNPの3ジェノタイプ頻度は変わらない。
ハプロタイプの頻度を変える意図はなかったから、変えてはいけない。9ジェノタイプのうち、2重ヘテロのそれ以外は、確定的にハプロタイプの分配パターンが決まるから、f_1を導入したことによって、変化したジェノタイプ頻度において、元のハプロタイプ頻度を実現するためには、2重ヘテロハプロタイプ組み合わせへの分割具合の変更で対応する。この対応が可能である範囲でしかf_1はとれないことになる。
最後にSNPがペアとなったことによる、ホモへテロ比率の変化を導入する。個別のSNPのジェノタイプ頻度はすでにそのSNPの固有のHWDを反映した値になっており、もちろん、SNPのアレル頻度、ハプロタイプの頻度もすでに確定しているので、それを変えないようなジェノタイプ頻度の変更を行う。
4つある、2重ホモのそれぞれについて、パラメタk_{ij}をとり、そのジェノタイプの頻度をk_{ij}倍することにする。
これによって、3x3表の行、列の和が変わらないという制約から、ヘミへテロの4ジェノタイプの頻度が確定的に決まる。さらに、2重ヘテロのそれも決まる。
2重ヘテロハプロタイプ組み合わせへの分配は、ハプロタイプ頻度が変わらないように行うものとする。
9ジェノタイプ(自由度8)のシミュレーションをするのに、9パラメタを用いている。これは、9ジェノタイプであるけれども、2重ヘテロを構成するジェノタイプが、2通りあり、見かけ上は区別していないかに見えるが、区別してジェノタイプ頻度を作成していることによる分である。
これを実行するエクセルはこちら