ごくごく短く連鎖解析を説明する

  • パラメトリック連鎖解析では、染色体の家系内での受け渡しと組み換えとのパターンをすべて数え上げます。
  • そして、表現型の情報と遺伝子型の情報を利用して、どの染色体のどの位置に原因因子が存在しているという仮説がもっともらしいかを調べます。
  • そして、その原因因子の存在場所としてもっともらしい箇所が、どれくらい原因因子のありかとして信憑性があるかを数値で示します。
  • まず、染色体の家系内での受け渡しと組み換えのパターンとはどういうことかを見てみましょう。
  • 家系図は、個人のつながりでしたが、それは、染色体の伝達のグラフを中に隠しもっているものです。
  • そして、染色体上の1点について限れば、かならず、木が描けます。
  • 今、家系図が与えられたとき、可能性のある木のパターンは、家系図での辺の数nに対して2^nあります。
  • これが、ゲノム上の1箇所に関する、木のパターン数であり、「仮説空間」を作る基です。
  • ゲノム上のすべての箇所は、同様に2^nパターンの可能性があります。
  • 全部で、L箇所のことを考えれば、(2^n)^Lと、膨大な数になります。
  • 実験で調べるマーカーの遺伝子型情報を利用すれば、ありえない木パターンと、ありえる木パターンが区別できます。
  • また、DNA配列に沿って木のパターンを追跡すると、ときどきしか変化しないはずで、変化する箇所というのは組み換えが起きたときになりますので、DNA上の位置に沿って、木のパターンの組み合わせ(2^n)^Lは、組み換えの起こりやすさを変数として取り込むことで、尤度の高いパターンの組み合わせと、尤度の非常に低いパターンの組み合わせがあることがわかります。
  • ここまでの作業で、木のパターンの組み合わせは、相変わらず少なくはないものの、ずいぶん減りますし、尤度の差も大きくなっています。
  • ここまでは、表現型の情報を使わずに話しを進めてきました。
  • ここから、表現型の情報を使います。
  • 優性遺伝形式であるとか、劣性遺伝形式であるとかを仮定して、遺伝子型が決まると、完全に表現型が決まるとしますと、家系図上の個人の「原因遺伝子の遺伝子型」が決まります。
  • このように遺伝子型が決まると表現型が完全に決まることを浸透率が1である、と言います。
  • 完全に決まる人も多く、ときに完全に決まらない人も出ますが、その人の「原因遺伝子の遺伝子型」は確率的に割り当てることが出来ます。
  • また、浸透率が1ではないときには、それに応じて、個々人の「原因遺伝子の遺伝子型」を確率的に割り当てることもできるでしょう。
  • ここまでに出てきた変数は、「組み換えの起こりやすさ」と「原因遺伝子の遺伝子型が一意に決められない・決めにくい場合の決め方」とに関するものです。
  • どちらも、与えることとします。
  • このように、遺伝形式を含めていくつかの変数を与えることから、パラメトリック(パラメタ(変数)を与える)と呼ばれます。
  • 最後に、「原因遺伝子の位置」を変数として与えます。
  • これは、知りたいものの本丸ですから、ゲノム上を動かしてやる必要があります。
  • 考えなくてはいけない、「仮説空間」は木のパターンの組み合わせとして与えられていますし、そのパターンが観察データ(遺伝子型と表現型)を起こしやすいかどうかは、尤度として計算すればよいです。
  • 「原因遺伝子の位置」をゲノム上で変化させると、組み換えを「原因遺伝子の位置」の前後で起きたことにしなければならないか、そうでないかの違いで、すでにあった木のパターンの組み合わせごとに尤度がさらに変化します。
  • そうすると、ゲノム上の位置を変数として、尤度の高低の分布が得られます。
  • 原因遺伝子の位置として、最も尤度の高いところが、もっとも原因遺伝子のある可能性の高いところです。
  • ここで、この原因遺伝子のありかと目されるところが、本当に、そうなのかどうかの判断は、原因遺伝子があったとしても、どのマーカーとも同じ染色体上に乗っていないとした場合(帰無仮説)の尤度と較べて、十分に高い尤度が得られるかどうかで判断します。
  • 尤度は比で判断すればよいので、帰無仮説の場合の尤度に較べて、10の何乗倍尤度が高いかを数値で表すことが多く、それをLOD(Logarithm of odds)スコアと呼びます。
  • 実際の計算では、木のパターンの組み合わせの網羅をどういう手順で計算するか、とか、木のパターンの組み合わせとはいっても、全マーカーでの組み合わせはせず、近いところのマーカーについてのみパターンの組み合わせを考慮するなどの実際上の工夫がなされます。