2 分離 メンデルの法則 Hardy-Weinberg平衡(2 The Analysis of Segregation and Population Frequencies)



  • 2.1 メンデルの分離の法則
    • 形質 phenotype:個体がもつ特性
    • アレル(アリル) allele:遺伝子が持つ特性(個体は複数(2つまでが普通)の相同遺伝子を持つので、複数のアレルを有する
    • ホモ接合体とヘテロ接合体(homozygotes, heterozygotes):個体が持つ2つのアレルのパターン。同一アレルを2つ持つか、異なるアレルを1つずつ持つかの区別
    • 遺伝形式:アレル保有のパターンと形質との関係。
      • dominant(優性)、recessive(劣性)、codominant(共優性)
  • 2.2 常染色体優性遺伝性疾患の分離解析(segregation analysis)
    • 基本:まれな形質が常染色体優性遺伝形式であるとき、形質の保有者は、形質非保有者との間に子を成し、その子は半数が形質保有者、半数が形質非保有者である。これが分離比[tec:\frac{1}{2}]である
    • 2.2.1 2項検定(binominal test)
      • ある形質が分離比¥frac{1}{2}になっているかどうかを検定する
      • n人中、k人が形質保有者で、n-k人が形質非保有者であったとき、分離非¥frac{1}{2}である仮定の下でこのような観測が成される確率Pは
        • P=_nC_k(¥frac{1}{2})^k (1-¥frac{1}{2})^{n-k}=_nC_k(¥frac{1}{2})^n
      • 今、分離比¥frac{1}{2}においてc ¥le kなるcがあって、n人中c人が形質保有者でn-c人が形質非保有者であると観測されることは、k人の形質保有者を観測することと同等以上に起き難い。同様に、形質非保有者がn-k人以下で観測されることも同等以上に起き難い。これらを足し合わせた値が、『分離比¥frac{1}{2}という帰無仮説を棄却する確率 P(Reject Null hypothesis)』に相当する
        • P(Reject Null hypothesis) = ¥sum_{i=0}^{k}_nC_i(¥frac{1}{2})^n + ¥sum_{i=n-k}^n_nC_i(¥frac{1}{2})^n=2¥times (¥frac{1}{2})^n ¥sum_{i=0}^{k}_nC_i
    • 2.2.2 2.2.3 2.2.4 2項検定の近似形
      • 2項検定は計算が面倒くさいので、サンプルサイズ(n)が大きめのときには、近似形を代用にする。2項分布は離散分布だが、nが大きくなると連続分布である正規分布に近似できる。この分布を用いて検定することができる。また、カイ自乗分布は、正規分布正規分布の自乗の性質があるので、2項分布はカイ自乗分布とそれを用いた検定にも近似できる。カイ自乗分布への漸近近似を用いる尤度比検定もまた、2項検定の近似形として用いることができる
      • 正規分布と2項分布
        • 正規分布は平均 m と分散 ¥sigma^2との2変量で特定される分布である。
          • f(x)=¥frac{1}{¥sigma ¥sqrt{2¥pi}}e^{-¥frac{1}{2}(¥frac{x-m}{¥sigma})^2
        • この正規分布が持つxに依存する量である、Z統計量は、上式のeの累乗の項は
          • Z=¥frac{X-m}{¥simga}で与えられる
        • 今、2項分布の観測事象確率がp(分離比¥frac{1}{2}においてはp=0.5)、観測総事象がnであるとき
          • m=np¥sigma^2=np(1-p)
        • p=¥frac{1}{2}の仮説に対して、観測総事象n、観測事象がkであるとき、対応するzは次式で表され、このようなkを観測したときに帰無仮説を棄却する確率は、このzに相当するP値である
          • z=¥frac{|k-¥frac{n}{2}|}{(¥frac{n}{4})^{¥frac{1}{2}}
      • 正規分布とカイ自乗分布(Pearson chi-squared test)
        • 観測総事象 n で、観測事象 {k, n-k} 。帰無仮説(観測は、p,1-pの確率で2項分布的に起きるとする)における観測事象数は {np,n(1-p)である。このような分割表のカイ自乗値は
          • ¥chi^2 = ¥frac{(k-np)^2}{np} + ¥frac{((n-k)-n(1-p))^2}{n(1-p)}
        • この式は、上述のzの自乗になっている
      • カイ自乗分布と尤度比検定
        • 尤度比検定では、上述の2項検定・Z検定・カイ自乗検定とはことなり(本当は異ならないわけだが)、帰無仮説のときの尤度と、対立仮説のときの尤度との尤度の違いを用いて結果的に帰無仮説を棄却する。
        • 観測事象を得る確率は、pの関数である。帰無仮説のとき[texp=\frac{1}{2}]。対立仮説においては、pを¥frac{1}{2}以外に設定できる。尤度比検定では、観測事象の尤度を最大にするpの値が与える尤度と、帰無仮説のときの尤度とを比較することで、帰無仮説の棄却を云々する。2項分布の場合、最大尤度を与えるpの値は、¥frac{k}{n}であるので、p=¥frac{1}{2}p=¥frac{k}{n}の2仮説のそれぞれが与える尤度を計算してやればよい。尤度比検定においては、2仮説の尤度の自然対数の差の2倍がパラメタ数の差を自由度とするカイ自乗分布に漸近近似できることが知られている
          • 2¥times (lnL_1-lnL_0) = 2¥times (ln(_nC_k(¥frac{k}{n})^k(1-¥frac{k}{n})^{n-k}) - ln(_nC_k(¥frac{1}{2})^k(1-¥frac{1}{2})^{n-k}) )
    • 2.2.5 推定値
      • 前項の尤度比検定において、最大尤度を与えるpの推定値は¥frac{k}{n}であると書いた。今、ある観測データをもとにして、分離比の推定値を求めたい。前項では、分離比が¥frac{1}{2}であるか否かを検定したのと少し趣きを異にする
      • 観測データからは、『この値が分離比の推定値として最もふさわしい値』と、分離比は『これくらいの確率でここからここまでの範囲におさまるだろう』という信頼区間とが推定される。
      • ¥frac{k}{n}最尤推定値と呼ばれる。観測データが観測されるもっともありやすい分離比の値のことである。nとkの値から¥frac{k}{n}として算術的に計算するのをモーメント法と呼び、変数pの関数である尤度関数の最大値を与えるようなpの値をなんらかの手法で(モーメント法でない方法で)推定するのが、最尤法と呼ばれる。
  • 2.3 共優性の分離解析
    • 優性の場合と考え方・方法ともに同様である
  • 2.4 常染色体劣性形質の場合の分離解析
    • 分離比は¥frac{1}{4}
    • 常染色体優性遺伝形質と異なり、劣性遺伝形質の場合には、リスクアレル保有者を同定することが簡単ではない。(すでに発病している子を持つ親を同定することと、リスクアレル保有者を発病子の有無によらず同定することとは異なる作業だからである)。したがって、リスクアレル保有者の子の発病率である分離比を求めることには、リスクアレル保有親の同定確率を考慮して進める必要がある。これを検討するにあたっては、発端者probands、という概念と用語があり、また、ある発病者が解析者に検出される確率としてascertainment probability(確認確率)という概念と用語が用いられる。
    • 複合遺伝性疾患解析において、2.2項で扱った内容の把握は妥当だが、complete ascertainment, incomplete ascertainmentの詳細は、関連が小さいので、割愛する。ただし、本書では、最尤推定値の算出手法であるEMアルゴリズム微分関数に対するNewton-Raphson法が扱われているので、それらについては取り上げるものとする
    • EM (Expectation-maximization)アルゴリズム
      • ある観測データから、ある変数を推定する。変数に値を与えることによって、観測データから変数の値を再計算できるというような、データ・変量構造になっているときに、このプロセスを繰り返すことによって、変数の最尤推定量を得る、という方法
    • Newton-Raphson法
      • ある変量がある値をとるときに尤度関数の極大値を与えるとする。このような変量の値は、尤度関数の変量による1次微分をゼロにすることを利用し、尤度関数の1次微分がゼロになる変量の値を挟み込み方式で推定する。
      • 尤度関数の1次微分をスコア関数、その微分をHessianと呼ぶ。変数が複数あるとき、スコア関数は変数の数だけあり、Hessianは変数の数x変数の数だけあることになる。1変数であるときは、いずれも1つずつである。
  • 2.5 メンデルの分離の法則からの乖離とその解釈
    • 非1ローカス
    • 形質保有の生存・生殖への影響
    • Phenocopy:同一形質を持つ個体の中に、複数のリスクアレル・原因アレルが存在している
    • incomplete penetrance
  • 2.6 Hardy-Weinberg 平衡
    • アレルa,bがアレル頻度p(a),p(b)を持つときに、ジェノタイプaa,ab,bbの頻度がp(a)p(a),2p(a)p(b),p(b)p(b)となることをHardy-Weinberg平衡という
    • Hardy-Weinberg平衡にあるという帰無仮説は、尤度比検定・カイ自乗検定等で検定することが可能である
  • このあたりの詳細は、少し古い文書で、改訂したい部分もなくはないが、こちらの目次の3-4-1 Hardy-Weinberg 平衡検定で。