2 分離 メンデルの法則 Hardy-Weinberg平衡(2 The Analysis of Segregation and Population Frequencies)
- 2.1 メンデルの分離の法則
- 2.2 常染色体優性遺伝性疾患の分離解析(segregation analysis)
- 基本:まれな形質が常染色体優性遺伝形式であるとき、形質の保有者は、形質非保有者との間に子を成し、その子は半数が形質保有者、半数が形質非保有者である。これが分離比[tec:\frac{1}{2}]である
- 2.2.1 2項検定(binominal test)
- 2.2.2 2.2.3 2.2.4 2項検定の近似形
- 2項検定は計算が面倒くさいので、サンプルサイズ(n)が大きめのときには、近似形を代用にする。2項分布は離散分布だが、nが大きくなると連続分布である正規分布に近似できる。この分布を用いて検定することができる。また、カイ自乗分布は、正規分布を正規分布の自乗の性質があるので、2項分布はカイ自乗分布とそれを用いた検定にも近似できる。カイ自乗分布への漸近近似を用いる尤度比検定もまた、2項検定の近似形として用いることができる
- 正規分布と2項分布
- 正規分布とカイ自乗分布(Pearson chi-squared test)
- 観測総事象 n で、観測事象 {k, n-k} 。帰無仮説(観測は、の確率で2項分布的に起きるとする)における観測事象数は {である。このような分割表のカイ自乗値は
- この式は、上述のzの自乗になっている
- 観測総事象 n で、観測事象 {k, n-k} 。帰無仮説(観測は、の確率で2項分布的に起きるとする)における観測事象数は {である。このような分割表のカイ自乗値は
- カイ自乗分布と尤度比検定
- 尤度比検定では、上述の2項検定・Z検定・カイ自乗検定とはことなり(本当は異ならないわけだが)、帰無仮説のときの尤度と、対立仮説のときの尤度との尤度の違いを用いて結果的に帰無仮説を棄却する。
- 観測事象を得る確率は、pの関数である。帰無仮説のとき[texp=\frac{1}{2}]。対立仮説においては、pを以外に設定できる。尤度比検定では、観測事象の尤度を最大にするpの値が与える尤度と、帰無仮説のときの尤度とを比較することで、帰無仮説の棄却を云々する。2項分布の場合、最大尤度を与えるpの値は、であるので、との2仮説のそれぞれが与える尤度を計算してやればよい。尤度比検定においては、2仮説の尤度の自然対数の差の2倍がパラメタ数の差を自由度とするカイ自乗分布に漸近近似できることが知られている
- 2.2.5 推定値
- 前項の尤度比検定において、最大尤度を与えるpの推定値はであると書いた。今、ある観測データをもとにして、分離比の推定値を求めたい。前項では、分離比がであるか否かを検定したのと少し趣きを異にする
- 観測データからは、『この値が分離比の推定値として最もふさわしい値』と、分離比は『これくらいの確率でここからここまでの範囲におさまるだろう』という信頼区間とが推定される。
- は最尤推定値と呼ばれる。観測データが観測されるもっともありやすい分離比の値のことである。nとkの値からとして算術的に計算するのをモーメント法と呼び、変数pの関数である尤度関数の最大値を与えるようなpの値をなんらかの手法で(モーメント法でない方法で)推定するのが、最尤法と呼ばれる。
- 2.3 共優性の分離解析
- 優性の場合と考え方・方法ともに同様である
- 2.4 常染色体劣性形質の場合の分離解析
- 分離比は
- 常染色体優性遺伝形質と異なり、劣性遺伝形質の場合には、リスクアレル保有者を同定することが簡単ではない。(すでに発病している子を持つ親を同定することと、リスクアレル保有者を発病子の有無によらず同定することとは異なる作業だからである)。したがって、リスクアレル保有者の子の発病率である分離比を求めることには、リスクアレル保有親の同定確率を考慮して進める必要がある。これを検討するにあたっては、発端者probands、という概念と用語があり、また、ある発病者が解析者に検出される確率としてascertainment probability(確認確率)という概念と用語が用いられる。
- 複合遺伝性疾患解析において、2.2項で扱った内容の把握は妥当だが、complete ascertainment, incomplete ascertainmentの詳細は、関連が小さいので、割愛する。ただし、本書では、最尤推定値の算出手法であるEMアルゴリズムと微分関数に対するNewton-Raphson法が扱われているので、それらについては取り上げるものとする
- EM (Expectation-maximization)アルゴリズム
- ある観測データから、ある変数を推定する。変数に値を与えることによって、観測データから変数の値を再計算できるというような、データ・変量構造になっているときに、このプロセスを繰り返すことによって、変数の最尤推定量を得る、という方法
- Newton-Raphson法
- 2.5 メンデルの分離の法則からの乖離とその解釈
- 非1ローカス
- 形質保有の生存・生殖への影響
- Phenocopy:同一形質を持つ個体の中に、複数のリスクアレル・原因アレルが存在している
- incomplete penetrance
- 2.6 Hardy-Weinberg 平衡
- このあたりの詳細は、少し古い文書で、改訂したい部分もなくはないが、こちらの目次の3-4-1 Hardy-Weinberg 平衡検定で。