作ってみる。
HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。
LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。
HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定められる要素と、SNPの組み合わせによって新規に生じる、ヘテロとホモの間の独立からの逸脱として定められる要素とに分解できる。
まず、2SNPのアレル頻度をとする。
連鎖平衡(LE)の仮定において、4ハプロタイプの頻度は
このまま、HWEの仮定でジェノタイプ頻度を決めるとすると
連鎖不平衡を導入する。
この設定で、2SNPのアレル頻度は影響を受けない。
9ジェノタイプの頻度も
のままとする。このとき、2SNPの3ジェノタイプの頻度はのままである。
ここに、SNP1のジェノタイプ分布がHWDにあるとして、その3ジェノタイプがとする。
9ジェノタイプの頻度を変更しないといけない。次のようにする。
これにより、個々のSNPの3ジェノタイプ頻度は変わらない。
ハプロタイプの頻度を変える意図はなかったから、変えてはいけない。9ジェノタイプのうち、2重ヘテロのそれ以外は、確定的にハプロタイプの分配パターンが決まるから、を導入したことによって、変化したジェノタイプ頻度において、元のハプロタイプ頻度を実現するためには、2重ヘテロのハプロタイプ組み合わせへの分割具合の変更で対応する。この対応が可能である範囲でしかはとれないことになる。
同様に、SNP2のHWDを、を用いて発生させる。
繰り返しになるが、これにより、個々のSNPの3ジェノタイプ頻度は変わらない。
ハプロタイプの頻度を変える意図はなかったから、変えてはいけない。9ジェノタイプのうち、2重ヘテロのそれ以外は、確定的にハプロタイプの分配パターンが決まるから、を導入したことによって、変化したジェノタイプ頻度において、元のハプロタイプ頻度を実現するためには、2重ヘテロのハプロタイプ組み合わせへの分割具合の変更で対応する。この対応が可能である範囲でしかはとれないことになる。
最後にSNPがペアとなったことによる、ホモへテロ比率の変化を導入する。個別のSNPのジェノタイプ頻度はすでにそのSNPの固有のHWDを反映した値になっており、もちろん、SNPのアレル頻度、ハプロタイプの頻度もすでに確定しているので、それを変えないようなジェノタイプ頻度の変更を行う。
4つある、2重ホモのそれぞれについて、パラメタをとり、そのジェノタイプの頻度を倍することにする。
これによって、3x3表の行、列の和が変わらないという制約から、ヘミへテロの4ジェノタイプの頻度が確定的に決まる。さらに、2重ヘテロのそれも決まる。
2重ヘテロのハプロタイプ組み合わせへの分配は、ハプロタイプ頻度が変わらないように行うものとする。
9ジェノタイプ(自由度8)のシミュレーションをするのに、9パラメタを用いている。これは、9ジェノタイプであるけれども、2重ヘテロを構成するジェノタイプが、2通りあり、見かけ上は区別していないかに見えるが、区別してジェノタイプ頻度を作成していることによる分である。
これを実行するエクセルはこちら。
- 改良する→こちら