HWEの正確検定



先日(ずいぶん前)に、HWEの正確検定についての記事を書いた(こちら)。

そこに登場してくる式を別の方法で説明してみる。

ExactHWEPを算出するエクセルはこちらの記事で紹介。

  • 変数の定義とくだんの式は以下のとおり
    • N人、2N本染色体、アレル(A/B)、n_A+n_B=2N,n_A:No.allele A,n_B:No.allele Bn_{AA}+n_{AB}+n_{BB}=N,n_{XY}:No.individulas with genotype XY、と表すこととすると、
    • n_{AA}=¥frac{n_A-n_{AB}}{2},n_{BB}=¥frac{n_{B}-n_{AB}}{2}と表せる。
    • n_A本のAアレルを観測したときに、n_{AB}人のヘテロを観測する確率は
    • P(N_{AB}=n_{AB}|N,n_A)=2^{n_{AB}}¥times ¥frac{¥frac{N!}{n_{AA}!n_{AB}!n_{BB}!}}{¥frac{(2N)!}{n_A!n_B!}}
    • n_{A}が奇数のときは、n_{B}も奇数で、n_{AB}は奇数。n_{AB}が偶数である確率は0。逆に、n_{A}が偶数のときは、n_{B}も偶数で、n_{AB}も偶数。n_{AB}が奇数となる確率は0となることに留意する。
  • 文献はこちら
  • 『別の説明』
    • 2N本の染色体は、A/Bの2タイプのアレルに分かれており、今、N人についてそのアレル保有数を観測している。このデータを、2xN分割表にまとめることが可能である。
      • たとえば、5人について、AAホモが2人、ABヘテロが2人、BBホモが1人だとしよう。2x5分割表ができる。

ABA+B
202
202
112
112
022
----------
6410

    • この2xN分割表について、与えられた周辺度数のもとでの観測分割表の観測確率は
      • ¥frac{2!¥times 2! ¥times ... 2! ¥times n_A! ¥times n_B!}{(2N)!¥times (2!)^{(n_{AA}+n_{BB})}¥times (0!)^{(n_{AA}+n_{BB})} ¥times (1!)^{n_{AB}}¥times (1!)^{n_{AB}}}
        • 分子の2!は、N個ある周辺度数に由来する
        • 分母の2!は、分割表の2を持つセルに対応する項であり、その数は、AA,BBホモの人数を合わせた数になる。同様に0!の項もそれと同数になる。
        • 分母の1!は、分割表の1を持つセルに対応する項であり、その数は、ヘテロの人数の2倍となる。
        • 今、分母の1!,0!はともに1であることと、分子と分母の2!の項の数の差は、ヘテロ個体数であることに注意すれば
      • =¥frac{(2!)^{n_{AB}} ¥times n_A! ¥times n_B!}{(2N)!}
      • N人について、3ジェノタイプを、それぞれn_{AA},n_{AB},n_{BB}で観測するとり方は
        • ¥frac{N!}{(n_{AA})!¥times (n_{AB})! ¥times (n_{BB})!}とおりあるので、
      • 2xN分割表の観測確率は
        • ¥frac{N!}{(n_{AA})!¥times (n_{AB})! ¥times (n_{BB})!} ¥times ¥frac{(2!)^{n_{AB}} ¥times n_A! ¥times n_B!}{(2N)!}