5 連続形質・偽(準)連続形質の解析 駆け足で読むPak Shamの統計遺伝学



  • 5.0 この章の基本
    • 形質=環境要因+遺伝要因(+偶然)
    • 量的形質には相関係数を求めることができる
    • 要因間にも相関係数を求めることができる
      • 偶然を入れないのがニュートン力学で、入れるのが量子力学に相当するとでも言うのでしょうか(そうすると、後者の場合には、サンプリングして観測してみるまでは形質は確定していないのかもしれないです)
    • 偶然の要素を考慮せず、すべての要因が確定可能であるとする
      • 観測した要因がすべて同一なサンプルの間にも形質(の値)の違いが存在する
      • その理由を、観測していない要因がもたらしていると考える
      • 複数の要因をプールした、1プール要因は量的形質にベル型の分布を与えるものとし、その分布は平均値と分散によって定義されるとみなす
  • 5.1 連続形質
    • 量的形質には、その値が独立か非独立かを表す指標として「相関」がある
  • 5.2 双生児解析
    • 双生児解析は『形質=環境要因+遺伝要因』の式の分解研究
    • 量的形質を、2つの要因(環境要因、遺伝要因)の視点から区別できる2グループ(一卵性双生児と二卵性双生児)について考察する
    • その手法としては、ANOVAがある
  • 5.3 Biometircal genetics
    • 形質をとらえるのに、平均値や分散といった、分布の指標を用いること
  • 5.3.1 遺伝因子の分散の分解
    • 遺伝因子を変数化する。その変数は形質の値を定める関数のパラメタである
    • 遺伝因子は独立な要因のこともあるが、他の遺伝因子と組み合わさることで生じる要素もあり、それが形質の値を定める関数のパラメタとなりうる
      • 遺伝因子の組み合わせ項として、Diplotypeの個々のアレルを変数としたときには、アレルの組み合わせを組み合わせ項としてとらせることが妥当なことが多い
      • 異なる遺伝子に与えた変数同士は、遺伝子-遺伝子間相互作用があるとき、組み合わせ項を持つことがある
    • 1ローカスの2アレル多型(2アレル:A,a、3ジェノタイプy_{AA},y_{Aa},y_{aa}、アレル頻度p_A,p_a、ジェノタイプ頻度p_A^2,2p_Ap_a,p_a^2)について、アレルを変数化する場合
      • 考えられる変数は、アレルA、アレルa、ジェノタイプAA、ジェノタイプAa、ジェノタイプaa、アレルA-Aを持つこと、アレルA-aを持つこと、アレルa-aを持つこと。そのほかにも、父由来でAをもつこと、母由来でAを持つこと、などの要因も考慮に入れられる
      • 由来親が何の寄与を持たないとした場合には、次のように3ジェノタイプのそれぞれの効果を3変数(y_{AA},y_{Aa},y_{aa}として扱うことで、個々のアレルの寄与分は書き表すことが知られており、それによって、このローカスのもたらす分散の総和V_GはAdditive効果分(V_AとDominance効果分V_Dとに分割される。ただし、V_Dy_{Aa}=¥frac{y_{AA}+y_{aa}}{2}なるときに0となるような項であることに注意する。また、このようなとき、このローカスは、完全にAdditiveなローカスであると言われる
        • V_G=V_A + V_D
        • V_A=2p_Ap_a(p_A(y_{AA}-y_{Aa})+p_a(y_{Aa}-y_{aa}))^2
        • V_D=p_A^2p_a^2(y_{AA}-2y_{Aa}+y_{aa})^2
    • 2ローカス(2アレル多型)の場合
      • 考え方は1ローカスの場合と同様である
      • 9ジェノタイプのそれぞれに対応する変数を定める。これらは、(1)個々のアレルの寄与分と、(2)それをローカス内で組み合わせる効果(Diploid効果)と、(3)2ローカス複合ジェノタイプ組み合わせ効果の複合として記述する
      • (1)、(2)の項は1ローカスでの検討ですでに変数化されている(V_A,V_D。(3)の項が2ローカスに拡張したために発生した項である。これをV_Iとする
      • V_Iの項はさらに、2ローカスの4アレルが(A-B),(A-b),(a-B),(a-b)と組み合わさる(diploidの効果は無考慮)項(V_{AA})と、片ローカスはdiploid、もう片ローカスは1アレルで組み合わさる効果項(V_{AD})と、2ローカス4アレルの組み合わせ項(V_{DD})とに分解できる
        • V_G=V_A+V_D+V_{AA}+V_{AD}+V_{DD}
    • 5.3.2 個人間の遺伝的相関関係と形質値相関関係との対比による解析
      • 前項までの記載は、ある集団がローカスにおいて、ある頻度でアレルを有するときに、その集団に観測される量的形質の分散をアレル頻度とローカスの形質への効果項とで説明するものであった
      • 本項は、個人と個人の遺伝的な遠近関係とローカスの形質への効果項との関係をもとに、形質値の遺伝要因を検討する
      • IBDとcoefficient of relationship
        • IBD Identity-by-descent
          • ある2個人において、あるローカスの保有アレルが同祖である数(0個、1個、または2個)
          • 血縁関係がわかっていれば、IBDが0,1,2の確率(p_0,p_1,p_2)は定まる
          • また、このIBD確率p_0,p_1,p_2から次の指標r=¥frac{1}{2}p_1+p_2を定め、これをcoefficient of relationshipと呼ぶ

関係p_0p_1p_2coefficient of relationship
MZ0011
DZ、同胞1/41/21/41/2
親子0101/2
祖父母-孫1/21/201/4
      • IBD確率p_0,p_1,p_2とcoefficient of relationship rとを用いて、血縁関係にある個人の形質値の相関を記述する
        • あるローカスの1つのアレルが同祖である確率は、rであり、あるローカスの2つのアレルが同祖である確率はp_2である。また、異なるローカスの1アレルと1アレルを共通で同祖で持つ確率は、r^2であり、異なるローカスの全4アレルのうち、3アレルを共有する確率はrp_2、最後に4アレルとも共有する確率はp_2^2であるから次の式が成り立つ(共分散)
          • Cov_G=rV_A+p_2V_D+r^2V_{AA}+rp_2V_{AD}+p_2^2V_{DD}
      • 遺伝的な相関は、Corr_G=¥frac{Cov_G}{V_G}で表し、一卵性双生児にあっては、r=1.p_2=1であるから、Corr_G=1となっている
    • 5.3.3 Heritabilityの推定
      • これを多数の血縁関係についてデータを取ることによって、V_A,V_D,V_AA,...のいずれの項が大きいか小さいかについての推定をすることも可能であり、それは、形質の遺伝形式についての推定作業となる
  • 5.4 スケール変換
    • 量的形質には単位がある。しかしながら、その単位が生物学的に意味のある単位であるとは限らない
    • 他方、ある測定単位で得られた量の単位変換をして解析をすると便利なこともある(たとえば、複数ローカスのMultiplicative効果があるとき、対数をとると個々のローカスの効果の和で表すことができるが、対数をとらなければ、多ローカスの組み合わせ項を変数化する必要がある)。このように単位変換は解析を単純にし、かつ、生物学的に妥当な場合もあるが、生物学的に意味を持たない変換もある
  • 5.5 Quasi-continusous characters(偽(準)連続形質)
    • 複合遺伝性形質は複数の遺伝子の効果によって、多段階形質になっているものと思われるが、その段階数が多いことと、多段階がなめらかな分布に近似できるため、連続形質に準じた取り扱いをすることができる。この準連続形質がリスクとなり、そのリスクに基づいて、離散的な形質が生じるとみなされる場合もある(この場合は、Liablity-threshold model)。
    • 準連続形質に多段階の閾値を定めることで、形質側にも複数のカテゴリを作ることが可能であり、現実に形質をその程度で分類することはよく行われている
  • 5.6 パス解析
    • 量的形質には、相関係数を求めることができる
    • パス解析においては、量的形質を決定するパラメタとパラメタ間に存在する関係を問題にする
    • パラメタ間には相関係数を求めることができる
    • 量的形質とパラメタの間にも相関係数を求めることができる
    • パス解析においては、独立したパラメタと、考慮するべきパラメタ-パラメタ間関係とが与えられる。その条件のもとでの、パラメタと量的形質との関係を解析することができる
    • パラメタと量的形質の関係、その適合度は尤度ベースで行うことができる
  • 5.7 Complex segregation 解析
    • Commingling 混合
      • 量的形質にあって、ある2アレルローカスが主要な遺伝因子であるとき、3ジェノタイプ別の形質値は同一分散を持つ3峰となると期待される。この期待分布と帰無仮説(1峰の分布)との間で尤度比較をすることによる検定が可能。その方法
    • Mixed model
      • 1ローカスとその他の多遺伝因子とを想定する。「その他の多遺伝因子」は正規分布の分散をもたらす。このモデルのもとで尤度ベースで推定・検定を行う
    • general transmission model
      • 同様な考え方で、親子の伝達尤度を基準にする
    • Quantitative trait loci(QTL) linkage analysis
      • 家系内・家系内サンプル間の遺伝的遠近が、連鎖解析においては、染色体上の位置ごとに算出される
      • 形質値の遠近関係も数値化される
      • 両者の関係を算出する