メモ



ハプロタイプ、というか、アレル、というかの空間の広さについて

今、i 種類のアレルによって、占められている染色体空間がある。第j番アレルの頻度をP_jと表せば、¥Large ¥sum_{k=1}^{i}P_k = 1である。今、このような空間がどのくらい広いかを考える。i 種類のアレルのそれぞれについて、離散的にそのアレル頻度を0から1までn個のアレル頻度を取らせるとする。たとえば、0,0.1,0.2,...,0.9,1のようにとらせるときは11個のアレル頻度を取らせていることになる。もし、i 種類のアレルのすべてがn個のアレル頻度を相互に束縛なくとるとすると、i 種類のアレル頻度の組み合わせ数はn^iで表される。今、i 次元空間中の点N = (P_1,P_2,¥cdots,P_i)を考えると、n^i個の点は、i 次元直行空間中にある長さ1のi 次元立方格子の点である。しかしながら、¥Large ¥sum_{k=1}^{i}P_k = 1の制約があるので、実際には、それより少ない点のみが可能であり、その点の数は、次の式で表される。

¥Large X^{i}(n)=¥prod_{k=1}^{i-1}¥frac{(n+k-1)}{k}

このようなi次元数列は、(i-1)次元数列と次のような関係にある。

X^{i+1}(n)-X^{i+1}(n-1)=X^{i}(n)

おそらく、このようなi次元数列には、名称があると思われるが、不勉強にしてちょっとわからない。

ただし、Dirichlet分布に従ったハプロタイプ頻度発生などは、このハプロタイプ空間を可動空間としたものである等を考慮しているのではないかと予想する。これも不勉強にして、どうつなぐのかわからない。

実例としては

i=2のときX^2(n)=ni=3のときX^3(n)=¥frac{n(n+1)}{2}i=4のときX^4(n)=¥frac{n(n+1)(n+2)}{6}i=5のときX^5(n)=¥frac{n(n+1)(n+2)(n+3)}{24}、それぞれのハプロタイプ空間は、直線、正三角形、正四面体、3次元空間で定義不能となっている。