連鎖不平衡
2アレル多型が2つある。そのアレル頻度をそれぞれp1,p2,q1,q2とする 連鎖平衡の下での4ハプロタイプの頻度をh1,h2,h3,h4とする Singularを使ってやってみる ring p=0,(p1,p2,q1,q2),lp; ring h=0,(h1,h2,h3,h4),lp; setring p; map f = h,p1*q1,p1*q2,p2*q…
昨日、LD領域における、SNP選択の話があった(こちら:まだ、記事が掲載されていないけれど…)。Lossoとベイズとを比較して、ベイズの方が、モデル適合性が高そうだ、という話だった(あくまでも紹介論文でのシミュレーションデータの話) LDの具合や、集団構造化…
市松模様とペアワイズでは見えない連鎖不平衡の関係はこちら
ほどほどの遠近関係の友達がいて、友達の多様度が高いとパワーが大きい Ks<-3 CheckDists<-seq(from=3,to=3,length.out=1) nperm<-100 ks<-c(2,5,10,50) #t1s<-acos(seq(from=0,to=1,length.out=20)) t1s<-seq(from=0,to=1,length.out=20)*pi/2 t2s<-seq(fro…
k次元空間にn個の単位ベクトルがある ベクトル同士の内積が関係を表す ペアワイズな内積が個計算される その内積から、k次元単位球面上にn個のベクトルを再配置する library(sphere) k<-5 n<-30 X<-RandomSphere(df=k,n=n) X #ペアワイズな内積の行列 Y<-X%*…
連続 離散 離散 パターン化した離散 現実的なパターン化していない(しにくい)離散 パターン化した離散 幾何的離散 連鎖不平衡的離散 幾何的離散 正単体を先端に付けた花束状態 初めは、先端は点で始まる 点が開いて行って、あるとき、持ち手と花束の先端とが…
昨日、「同じのマーカーの取り方について書いた とは、マーカー間の関係を数値化したものであるので、それを角度ととらえて、幾何的に考えることにする 球と単体とは、「相互関係がそろっている点」を扱う仕組みであるのは、こちらの記事の通りなので、それ…
久しぶりにSNPデータのR処理の話し SNPデータからIBD推定としてz0,z1,z2を算出する(こちら)が、この3つの値は足し合わせると1になるので、自由度が2〜2次元平面に描ける。 z0,z1,z2をそれぞれ正三角形の頂点にとって描く # サンプル数 Nsample<-100 # rd…
Rのimage()関数を使ってペアワイズLDプロットを簡単に描く方法を以前書いた(こちら)。 今日は、ハプロタイプの01表記ファイル"hoge.txt"から描くことにする。 横がマーカー、縦に染色体。こんな感じ。 0 0 0 0 1 0 1 1 0 1 0 1 1 0 0 1 1 1 0 0 1 0 0 0 1 …
、2SNPのアリル頻度をとする。 ハプロタイプの頻度は もしくは 確かめ算のためのエクセルはこちら。
連鎖不平衡係数などの値を格納した、正方行列型の以下のようなテキストファイル、"hoge.txt"を作ったとする。 Rのimage()関数で、これをグレースケールで表したいとする。84段階表示なら HOGE<-read.table(file="hoge.txt") HOGEmatrix<-as.matrix(HOGE) q<…
ディプロタイプとして、同居したハプロタイプ2本のヘテロ座位の間に組み換えが発生しうる。 組み換えは、遺伝的距離(物理的距離と組み換え率)が定める。 ディプロタイプとして、異なるハプロタイプ2本が同居するかどうかをHWDが定める。
HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。 LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。 HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定めら…
LEのときの頻度とLDのときの頻度の差をとし、LDのときのハプロタイプ頻度を次のように表すと、9ジェノタイプの乖離は
HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。 LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。 HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定めら…
以前、こんな記事を書いた。 A novel method to express SNP-based genetic heterogeneity,Ψ, and its use to measure linkage disequilibrium for multiple SNPs, Dg, and to estimate absolute maximum of haplotype frequency用あって、これの、日本語の…
1つの2値従属変数について、2つの2値独立変数との独立性を検定する場合を考える。 2つの独立変数について、個々のサンプルは{0,0},{0,1},{1,0},{1,1}の4通りの値セットを持つ。 今、この4値セットの間の関係を考える。Pearsonの相関係数も算出できる…
正四面体は、n次元正超(n+1)胞体のn=3のもの(http://metatron.la.coocan.jp/zone-02/215.htm) 正四面体格子の点の数はこちら 1辺の長さがkである、n次元正超(n+1)胞体格子の点の数は これは、n+k-1とnとk-1との組合せ数の式に同じ この数をとすると、次の漸…
四面体の持つ4頂点のうち、1つを含む。この1つをもう一つの分体と共有しているので、八分の一()を所有している。 四面体の持つ、「SNP1個に相当する4辺」のうちの1辺の半分を有する。この半分辺は他の分体と共有しておらず、八分の一()を有しているこ…
作図アプリケーション シンデレラはこちら
関連する記事はこちら。 遺伝的浮動 多面体 連鎖不平衡の正四面体表現 まず、集団の2SNP、4ハプロタイプの初期頻度を与え、集団サイズを固定したうえで、次世代のハプロタイプ型は当該世代のハプロタイプ構成頻度からランダムに選ぶことで浮動をシミュレー…
2SNP連鎖不平衡が1変数で取り扱えることは、こちら。 1変数なら、エクセルでも簡単に扱えるはずで、それを示したのはこちら。 普通のEMの結果との照合はこちらの、3-5-2-3-1-2 (Excel) 2 SNP Haplotype頻度推定、LD D' r^2 LOD算出とLD尤度比検定 (新 Ite…
3月末から何日かに渡り、SNPの連鎖不平衡に関する記事を書いた。それのエッセンスは 連鎖不平衡は、染色体上に乗っていることによって存在する、アレル間の非独立性のことである。 SNPが複数あると、独立であるということは、非常に細かくあっちもこっちも…
染色体本数がnであるとき、はハプロタイプ観測数の2x2分割表における、ピアソンの独立性検定統計量に一致するのだが、これについての引用文献が見つからずにいたが、こんなところにあった。 Nat Rev Genet. 2006 Oct;7(10):781-91.Click here to read Links …
『格子』についてのwikipediaの記事はこちら。各座標の値を整数値として持つ点のうち、隣接する点を結んだものを幾何学上の格子という。 先日、SNPのペアワイズハプロタイプ頻度の分布を正四面体上の点として表現することについて書いた(記事こちら)。 ペア…
先日、正四面体の3次元座標を参照するサイトをメモした(記事はこちら)。ここで紹介されている正四面体の3次元座標は、1辺の長さが2の正四面体である。今、大きさの異なる2つの正四面体の頂点座標を示す。 1つは、1辺の長さが1のそれ。もう一つは、合…
昨日の記事で、SNP(2カテゴリカルデータ)の場合、個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数はであることを記した。 また、個の2カテゴリカルデータの独立性を考えるにあたり、個すべての独立性を説明するために必要な変…
SNP(2カテゴリカルデータ)の場合、個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数はである。一方、個のマーカーを考えるとき、個のマーカーの組合せは通りあるが、通りのマーカー組合せの独立性を説明するために必要な変数の数…
集合において,との関係を包除原理では、プラスとマイナスで扱っていた SNPのアレル頻度を方や,方やとする代わりに、,としてみる。 k個のSNPがあり、それらが独立であるとき、k個のSNPが作るハプロタイプ頻度はで表される(ただし、はハプロタイプを構成する個…