集団構造化・Inbreeding・IBDの指標の意味するところ

集団の構造化をFstで表したり、Inbreeding coefficiency Fがヘテロ接合体の比率に影響を与えたりする。FstはHeterozygosityを階層的に定め、それらの関係を示す一連のF値の一つである。
これらは、どういう指標であって、どういう関係にあるのだろう。
構造化とinbreedingとは、ともにrandom matingからずれている状態を表している。
random matingからのずれは、アレルの頻度に基づいて、アレルが相互に独立であると仮定したときのdiplotypeの頻度と、実際の頻度の違いとを生じるので、構造化もinbreedingもそれを利用して定量化することができる。
ホモが増えることに着目してもよし、ヘテロが減ることに着目してもよいが、ヘテロが減ることに着目することが多い。
期待されるヘテロの程度と実際のヘテロの程度が分かったら、それの比をとるもよし、期待されるヘテロと実際のヘテロが一致する状態と、ヘテロが少ない極限の状態との2状態を基準にして、その2基準点に照らして量表現することも可能である。基準2状態に照らして量表現するときに、線形式を使って0から1までの量で表すことは、単純でわかりやすいのという理由から指標化の際に用いられる。
この期待状態と極端状態についての線形数値化の指標がFstを含む、Fの指標たちである。いろいろなFがあるのは、対象を何にして、期待状態の定義を何にするかに依存するためである。
この流れのなかで階層的構造化指標を考える。
今、何でもよいけれど、相互に何かしら関係のある状態がS=\{s_1,s_2,...,s_n\}あったとする。それぞれの状態について、ある0でない量V=\{v_1,v_2,...,v_n\}が定義出来るとする。
すると、\prod_{i=1}^{n-1} \frac{v_i}{v_{i+1}}=\frac{v_1}{v_n}
このような状態セットと対応する量の値のセットがあるときに、状態に順序があると、状態の階層構造がVによって、『どこの階層を切り出しても、切り出す階層の厚みを増減させても』関係式が維持されるので、便利です。
Heritabilityについてこれを用いて、しかもF_{i,j} = \frac{H_j-H_i}{H_j}という定義を用いて、(1-F_{IS})(1-F_{ST})=1-F_{IT}なる関係であることが、いわゆるF_{ST}に関係する3つのFの背景である。つまり、F_{ST}についてはI,S,Tの3状態の階層構造を特に取り出していることになるが、n=3に限ル必要は本日的にはない。
F_{IS}はinbreeding coefficient Fであるが、これは、同祖でないアレルのみからなる祖先集団から近親交配を含む交配を経て得られた集団があったときに、Fの割合で同祖のとなり1-Fの割合で非同祖となるようなメイティング過程だったと仮定したときに得られる、ディプロタイプ分布がFを用いて表現できる、という点でFはIBDとつながってくる。
さらに進んで、近親交配を含む家系図があったときに、そのinbreeding coefficientの計算は家系図が作るループについて、F=\sum_{L=\{l_i\}: loops} (\frac{1}{2})^{distance(l_i)}\times f( l_i)、ただし、f(l_i)はループl_iにおける最も祖先側の個体のinbreeding coefficint。