Wright’s F-statistics,hierarchic subdivisions(Population subdivisionにおける)



  • F_{ST},F_{IT}.F_{IS}の3つからなる統計量である。
  • 亜集団間の関係を表しているのは、そのうちのF_{ST}になる。以下ではF_{ST}を中心に述べる。
    • HWE検定(関連記事はこちら)、Fixation index(関連記事はこちら)では、ある集団の内部構造を検討していた。そこに存在する全個体のアレルの分布について検討することによりSubdivisionを解析した。
      • これは言い換えると、集団中に2N本の染色体が存在し、それが、N人のdiploidに振り分けられた分配具合を、集団全体での均一性に照らして検討することに当たる。
      • Fixation 仮説では、アレルが消失するか、席捲するか、の2方向(2次元)であることに留意する。また、同サイズの亜集団に固定することを想定している。
    • 他方、Wright's F-statistics,hierarchic subdivisionsでは、複数の亜集団を想定しており、亜集団の多型のアレル頻度が均一であることが「均一性」の基準である。亜集団のサイズは同一である必要はない。
    • 多段階のsubdivision解析
      • 集団中のN人を、n_1,n_2,¥cdots,n_k; ¥sum_i^k n_i = 2Nとなるようなk亜集団に分け、そのk亜集団の相互関係について分析することが可能である。それぞれの亜集団は、さらに細かく亜亜集団に分けて分析することも可能である。
      • k亜集団間でのsubdivision
        • p_1=p_2=¥cdots=p_kがからのずれの具合を量的に評価する。
    • Wright's F統計量のうちのF_{ST}は次の式で表される
      • F_{ST}=¥frac{A}{f(1-f)}、ただし、A:アレル頻度の標本分散、fはアレル頻度の相加平均
        • f = ¥frac{¥sum_{i}{k}p_i}{N}
        • A = ¥frac{¥sum_{i}^{k}(p_i-f)^2}{k}
      • 亜集団のアレル頻度の標本分散を、与えられたアレル頻度のもとでとりうる最大の分散で割った値、となっている。
      • 今、H_S=2¥times f ¥times (1-f) (1-F_{ST})と置くと、このH_Sは亜集団から2本の染色体を取り出したときに、それが異なるアレルとなっている確率を亜集団にわたって、加算平均した値になっている。
      • この性質は次のようにも言い換えられる
        • p={p_1,p_2,¥cdots,p_k}の要素が
          • すべて同一のときF_{ST}=0
          • 0か1の2種類になるときF_{ST}=1
      • このF_{ST}には次のような性質がある。
        • 亜集団に分ける代わりに、2N本の染色体に細分すると、かならず、F_{ST}=1となる
        • N人のdiploid個人に細分すると、N人の集団全体でHWEの場合には、F_{ST}=0.5が成立し、HWEからはずれるとF_{ST}>0.5となる。Heterozygosity(観測値)=0のとき、F_{ST}=1となる。
        • Nより小さい数M亜集団にわけたとき、そのM亜集団のアレル頻度が同一であるとき、F_{ST}=0となる。
          • M亜集団がそれぞれHWEになっているとき、F_{ST}の値は、集団全体のFixation indexに一致する。集団全体のHWEからのずれがsubdivisionによってすべて説明された状態に相当する。
            • M亜集団のアレル頻度が0と1の2極化していくと、F_{ST}は1に収束する。
          • M亜集団(のいずれか1つ以上)がHWEになっておらず、亜集団内にsubdivisionが存在するとき、F_{ST}は、集団のFixation indexよりも小さくなる。説明されていないsubdivisionが存在する状態に相当する。
        • 亜集団に分けていない(1群に分ける)で考えると、かならず、F_{ST}=0となる。集団全体に認められているHWEをsubdivisionで説明していない状態。

      • 全体集団が亜集団に分けれられて、その亜集団のそれぞれがHWEにある場合、次の関係がある。ただし、HWE集団の数は2以上である。
        • F_{ST}の値は、分割亜集団のサイズが同一のとき、集団全体のFixation indexに一致する。
        • HWEにある亜集団に分割すると、F_{ST}= C ¥ge 0
        • 今、11-12-22の3ジェノタイプの観測数が与えられたとき、HWEにある2亜集団を想定してそれらに分けることが可能である(小数点以下の端数は無視する。2亜集団の人数・アレル頻度を与えるのに4変数を用い、3ジェノタイプの観測人数が与えられているから、連立方程式は3等式からなる)。したがって、任意のSNPジェノタイプ観測数は、HWEにある2亜集団に分配できる。また、各HWE亜集団は、適当に分割することにより、同一アレルの少人数HWE亜亜集団にも分割可能であり、そのようにすることで、もとの集団は、同一サイズのHWE亜亜集団に分割することができる。そのような亜亜集団分割(同一サイズのHWE亜亜集団への分割)をしたとき、次の関係にある
          • F_{ST}= Fixation index =1-¥frac{H_o}{H_e}=1-¥frac{H_o}{2p(1-p)}=¥frac{cov(y_1,y_2)}{¥sqrt{(var(y_1)var(y_2)}}=¥rho
          • このことは、ある集団について、Fixation index Fを計算するということは、仮想的なHWEな2亜集団への分離の具合を想定しているということでもあり、必ずしもHWEにない複数亜集団間のばらつきF_{ST}を計算している
  • F_{ST}以外のWright's F統計量
    • F_{IT} Wright's total inbreeding coefficient
      • 集団全体のHeterozygosity,H_oの観測値と亜集団のアレル頻度の相加平均とから、次のように定義したもの
        • F_{IT}=1-¥frac{H_o}{2¥times f ¥times (1-f)}
      • 集団全体のFixation indexを亜集団のアレル頻度平均を基準に数値化した値
    • F_{IS}
      • 亜集団内のFixation index(もしくは、亜集団内 F_{ST})を集団全体について代表させる値
        • 3種類ある(それぞれの値の差の確認はエクセルファイル(こちら)で。
          • 単純平均(Unweighted mean)
          • 加重平均(Weighted mean)
          • 次の式で定義される値 F_{IS}
            • (1-F_{IT})=¥frac{(1-F_{IS})}{(1-F_{ST})}

      • 別の機会に掲載したF-statisticsに関する記事はこちら