メモ

2x3表がある
ケースN人、コントロールM人、合わせてT人
ケース・コントロールを合わせた、SNPの3ジェノタイプカウントが、a+b+c=Tとする
合算のアレル頻度がr=(a+b/2)/T、、HWE下で期待されるヘテロの数がbe=2Tr(1-r)
f=1-b/be
今、ケースとコントロールはそれぞれ、HWEにある集団であるとすると
ケースのアレル頻度p,コントロールのアレル頻度qは、それぞれ、p=r+\sqrt{\frac{M}{N}}\sqrt{-r^2+\frac{a}{T}}
q=r+\sqrt{\frac{N}{M}}\sqrt{-r^2+\frac{a}{T}}
で与えられる。
このようなp,qを用いてfを書き直すと、f=\frac{NM(p-q)^2}{(Np+Mq)(N(1-p)+M(1-q))}
ここで、\sqrt{-r^2+\frac{a}{T}}平方根記号の中の第1項は、ケース・コントロール合算のアレル頻度の自乗であり、それは、HWEを仮定したときのそのホモのジェノタイプ頻度である。他方、第2項はそのジェノタイプの観測上の頻度である。したがって、HWE条件下での期待度数と観測度数とで、観測度数が大きいとき、p,qは実数解を持ち、そうでないとき、虚数解を持つことがわかる。p,qが実数解を持つ条件は、fが0以上である条件と一致する。

p,qの導出:
r=\frac{Np+Mq}{T}からq=\frac{T}{M}r-\frac{N}{M}p
Np^2+Mq^2=aに代入して
Np^2+M(\frac{T}{M}r-\frac{N}{M}p)^2=a
Np^2+M\frac{N^2}{M^2}p^2-2M\frac{NT}{M^2}rp+M\frac{T^2}{M^2}r^2-a=0
\frac{NT}{M}p^2-2\frac{NT}{M}rp+\frac{T^2}{M}r^2-a=0
p^2-2rp+\frac{T}{N}r^2-\frac{M}{NT}a=0