連鎖不平衡

連鎖平衡を代数統計する

2アレル多型が2つある。そのアレル頻度をそれぞれp1,p2,q1,q2とする 連鎖平衡の下での4ハプロタイプの頻度をh1,h2,h3,h4とする Singularを使ってやってみる ring p=0,(p1,p2,q1,q2),lp; ring h=0,(h1,h2,h3,h4),lp; setring p; map f = h,p1*q1,p1*q2,p2*q…

高次の因子

昨日、LD領域における、SNP選択の話があった(こちら:まだ、記事が掲載されていないけれど…)。Lossoとベイズとを比較して、ベイズの方が、モデル適合性が高そうだ、という話だった(あくまでも紹介論文でのシミュレーションデータの話) LDの具合や、集団構造化…

ペアワイズでは隠れている連鎖不平衡

市松模様とペアワイズでは見えない連鎖不平衡の関係はこちら

パワーを上げる友達

ほどほどの遠近関係の友達がいて、友達の多様度が高いとパワーが大きい Ks<-3 CheckDists<-seq(from=3,to=3,length.out=1) nperm<-100 ks<-c(2,5,10,50) #t1s<-acos(seq(from=0,to=1,length.out=20)) t1s<-seq(from=0,to=1,length.out=20)*pi/2 t2s<-seq(fro…

ペアワイズLDの幾何配置

k次元空間にn個の単位ベクトルがある ベクトル同士の内積が関係を表す ペアワイズな内積が個計算される その内積から、k次元単位球面上にn個のベクトルを再配置する library(sphere) k<-5 n<-30 X<-RandomSphere(df=k,n=n) X #ペアワイズな内積の行列 Y<-X%*…

ただのメモ

連続 離散 離散 パターン化した離散 現実的なパターン化していない(しにくい)離散 パターン化した離散 幾何的離散 連鎖不平衡的離散 幾何的離散 正単体を先端に付けた花束状態 初めは、先端は点で始まる 点が開いて行って、あるとき、持ち手と花束の先端とが…

同じのとり方はいくつある?2

昨日、「同じのマーカーの取り方について書いた とは、マーカー間の関係を数値化したものであるので、それを角度ととらえて、幾何的に考えることにする 球と単体とは、「相互関係がそろっている点」を扱う仕組みであるのは、こちらの記事の通りなので、それ…

図示する

久しぶりにSNPデータのR処理の話し SNPデータからIBD推定としてz0,z1,z2を算出する(こちら)が、この3つの値は足し合わせると1になるので、自由度が2〜2次元平面に描ける。 z0,z1,z2をそれぞれ正三角形の頂点にとって描く # サンプル数 Nsample<-100 # rd…

Rのimage()関数を使ってペアワイズLDプロットを簡単に描く方法を以前書いた(こちら)。 今日は、ハプロタイプの01表記ファイル"hoge.txt"から描くことにする。 横がマーカー、縦に染色体。こんな感じ。 0 0 0 0 1 0 1 1 0 1 0 1 1 0 0 1 1 1 0 0 1 0 0 0 1 …

アリル頻度とからハプロタイプ頻度を逆算

、2SNPのアリル頻度をとする。 ハプロタイプの頻度は もしくは 確かめ算のためのエクセルはこちら。

Rのimage関数を使って、簡単色グラデーション表示

連鎖不平衡係数などの値を格納した、正方行列型の以下のようなテキストファイル、"hoge.txt"を作ったとする。 Rのimage()関数で、これをグレースケールで表したいとする。84段階表示なら HOGE<-read.table(file="hoge.txt") HOGEmatrix<-as.matrix(HOGE) q<…

Hardy-Weinberg不平衡と連鎖不平衡の混合状態の捕捉

ディプロタイプとして、同居したハプロタイプ2本のヘテロ座位の間に組み換えが発生しうる。 組み換えは、遺伝的距離(物理的距離と組み換え率)が定める。 ディプロタイプとして、異なるハプロタイプ2本が同居するかどうかをHWDが定める。

改良する

HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。 LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。 HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定めら…

LDのときのジェノタイプ頻度とLEのときの差

LEのときの頻度とLDのときの頻度の差をとし、LDのときのハプロタイプ頻度を次のように表すと、9ジェノタイプの乖離は

作ってみる。

HWDもLDも、SNPペアのジェノタイプの分布に従属性を発生させる要因である。 LDは、1パラメタにて9ジェノタイプ全体に及ぶ依存関係を発生させる。 HWDは、階層構造をなしており、個々のSNPについてヘテロとホモとの間のHWEからの乖離として定めら…

一般化連鎖不平衡係数(覚え書き追加)

以前、こんな記事を書いた。 A novel method to express SNP-based genetic heterogeneity,Ψ, and its use to measure linkage disequilibrium for multiple SNPs, Dg, and to estimate absolute maximum of haplotype frequency用あって、これの、日本語の…

独立変数同士の関係

1つの2値従属変数について、2つの2値独立変数との独立性を検定する場合を考える。 2つの独立変数について、個々のサンプルは{0,0},{0,1},{1,0},{1,1}の4通りの値セットを持つ。 今、この4値セットの間の関係を考える。Pearsonの相関係数も算出できる…

正四面体中の格子座標

正四面体は、n次元正超(n+1)胞体のn=3のもの(http://metatron.la.coocan.jp/zone-02/215.htm) 正四面体格子の点の数はこちら 1辺の長さがkである、n次元正超(n+1)胞体格子の点の数は これは、n+k-1とnとk-1との組合せ数の式に同じ この数をとすると、次の漸…

連鎖平衡状態を表すための正四面体の部分体

四面体の持つ4頂点のうち、1つを含む。この1つをもう一つの分体と共有しているので、八分の一()を所有している。 四面体の持つ、「SNP1個に相当する4辺」のうちの1辺の半分を有する。この半分辺は他の分体と共有しておらず、八分の一()を有しているこ…

連鎖平衡曲面

作図アプリケーション シンデレラはこちら

連鎖平衡曲面

関連する記事はこちら。 遺伝的浮動 多面体 連鎖不平衡の正四面体表現 まず、集団の2SNP、4ハプロタイプの初期頻度を与え、集団サイズを固定したうえで、次世代のハプロタイプ型は当該世代のハプロタイプ構成頻度からランダムに選ぶことで浮動をシミュレー…

場合わけによる正確な期待値

2SNP連鎖不平衡が1変数で取り扱えることは、こちら。 1変数なら、エクセルでも簡単に扱えるはずで、それを示したのはこちら。 普通のEMの結果との照合はこちらの、3-5-2-3-1-2 (Excel) 2 SNP Haplotype頻度推定、LD D' r^2 LOD算出とLD尤度比検定 (新 Ite…

一般化連鎖不平衡係数の提案論文

3月末から何日かに渡り、SNPの連鎖不平衡に関する記事を書いた。それのエッセンスは 連鎖不平衡は、染色体上に乗っていることによって存在する、アレル間の非独立性のことである。 SNPが複数あると、独立であるということは、非常に細かくあっちもこっちも…

r^2とピアソン検定量

染色体本数がnであるとき、はハプロタイプ観測数の2x2分割表における、ピアソンの独立性検定統計量に一致するのだが、これについての引用文献が見つからずにいたが、こんなところにあった。 Nat Rev Genet. 2006 Oct;7(10):781-91.Click here to read Links …

正四面体中の格子座標

『格子』についてのwikipediaの記事はこちら。各座標の値を整数値として持つ点のうち、隣接する点を結んだものを幾何学上の格子という。 先日、SNPのペアワイズハプロタイプ頻度の分布を正四面体上の点として表現することについて書いた(記事こちら)。 ペア…

ペアワイズLDの正四面体表現

先日、正四面体の3次元座標を参照するサイトをメモした(記事はこちら)。ここで紹介されている正四面体の3次元座標は、1辺の長さが2の正四面体である。今、大きさの異なる2つの正四面体の頂点座標を示す。 1つは、1辺の長さが1のそれ。もう一つは、合…

組合せマーカー数の増加と自由度の増加のこと(SNPの場合から一般化)

昨日の記事で、SNP(2カテゴリカルデータ)の場合、個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数はであることを記した。 また、個の2カテゴリカルデータの独立性を考えるにあたり、個すべての独立性を説明するために必要な変…

組合せマーカー数の増加と自由度の増加のこと(SNPの場合)

SNP(2カテゴリカルデータ)の場合、個のマーカーがあるとき、そのすべての独立性を考慮するために必要な変数の数はである。一方、個のマーカーを考えるとき、個のマーカーの組合せは通りあるが、通りのマーカー組合せの独立性を説明するために必要な変数の数…

SNPの2アレルを±に対応させる

集合において,との関係を包除原理では、プラスとマイナスで扱っていた SNPのアレル頻度を方や,方やとする代わりに、,としてみる。 k個のSNPがあり、それらが独立であるとき、k個のSNPが作るハプロタイプ頻度はで表される(ただし、はハプロタイプを構成する個…