改良する

HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。
LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。
HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定められる要素と、SNPの組み合わせによって新規に生じる、ヘテロとホモの間の独立からの逸脱として定められる要素とに分解できる。
まず、2SNPのアレル頻度をp_1,p_2とする。
連鎖平衡(LE)の仮定において、4ハプロタイプの頻度はh_1=p_1p_2,h_2=p_1(1-p_2),h_3=(1-p_1)p_2,h_4=(1-p_1)(1-p_2)
このまま、HWEの仮定でジェノタイプ頻度を決めるとすると
g_{11}=h_1^2,g_{12}=2h_1h_2,g_{13}=h_2^2
g_{21}=2h_1h_3,g_{22}=2(h_1h_4+h_2h_3),g_{23}=2h_2h_4
g_{31}=h_3^2,g_{32}=2h_3h_4,g_{33}=h_4^2
連鎖不平衡を導入する。
h_1=p_1p_2+d,h_2=p_1(1-p_2)-d,h_3=(1-p_1)p_2-d,h_4=(1-p_1)(1-p_2)+d
この設定で、2SNPのアレル頻度は影響を受けない。
ここの4ハプロタイプの頻度についてはp_1=\frac{1}{2}(\psi_1+1),1-p_1=\frac{1}{2}(-\psi_1-1)とした上で、h_1=\frac{1}{4}(\psi_{1,2}+\psi_1+\psi_2+1)h_2=\frac{1}{4}(-\psi_{1,2}+\psi_1-\psi_2+1)h_3=\frac{1}{4}(-\psi_{1,2}-\psi_1+\psi_2+1)h_4=\frac{1}{4}(\psi_{1,2}-\psi_1-\psi_2+1)と置くこともできる。

10ジェノタイプの頻度を表す。
g_{11}=h_1^2,g_{12}=2h_1h_2,g_{13}=h_2^2
g_{21}=2h_1h_3,g_{22(AB-ab)}=2h_1h_4,g_{22(Ab-aB)=h_2h_3,g_{23}=2h_2h_4
g_{31}=h_3^2,g_{32}=2h_3h_4,g_{33}=h_4^2
のままとする。
6つのヘテロジェノタイプの頻度をf_{12},f_{13},f{14},f_{22},f_{24},f_{34}を用いて
g_{ij}'=g_{ij}(1-f_{ij}),i\ne jと表すことにすると、

g_{ii}'=g_{ii}+\frac{1}{2}\sum_{j}(g_{ij}f_{ij})
と書けて、この式は、1SNPのときにg_{hetero}=2p(1-p)(1-f),g_{homo}=p^2+p(1-p)f,g_{opposite-homo}=(1-p)^2+p(1-p)fと書けるのと対応する。ただしfはFixation coefficient.


これを実行するエクセルはこちら