FST (FST:検索可能なように)



多型のアレル頻度からWright's F 統計量を算出する。Wright's F統計量は集団中のsubstructureの程度を定量的に現したものである。Wright's F統計量は、次のような根拠を用いる。集団のsubstructureは、ランダムメイティングが起きていないことと同じである。今、ランダムメイティングをしている亜集団が集まってできた集団について考える。その集団を構成する亜集団同士の差異を数値化し、集団について1つの数値として与えたものがFSTである。亜集団内では、Hardy-Weinberg平衡が成立しており、集団内ではHomozygotesの過剰、Heterozygotesの過少が存在する。亜集団に観測されるアレル頻度を元に、HWEを満たしているものとしてHeterozygosity(2*p*(1-p))を算出する。集団全体についても、亜集団のアレル頻度の(単純な)平均値をもとに、HWEを満たしているものとしてHeterozygosityを算出する。今、亜集団において算出したheterozygosityの(単純な)平均値(HS)と、集団全体について算出したheterozygosityの値(HT)は、異なる。この差は、集団を構成する亜集団のアレル頻度のばらつきが大きければ大きいほど大きくなり、substructureの指標として用いることが可能である。F_{ST}=¥frac{H_{T}-H_{S}}{H_{T}} で定義される。今、2アレル多型に関するFSTについては、次の式においても算出できることが、式変換をすることで示されている(ここでは式変換については示していない)。N亜集団のそれぞれのアレル頻度から、標本分散Vを求める。また、N亜集団のアレル頻度の(単純な)平均値をpとする。F_{ST}=¥frac{V}{(p¥times(1-p))} である。

複数亜集団のアレル頻度情報から、そのFSTを計算するJavaソースはryamadaのコンピュータ日記 - Population genetics

分数の書き方については、ryamadaのコンピュータ日記 - てふを参照。