連鎖不平衡

集合のグラフ表現

べき集合 k個の要素を持つ集合のべき集合はある。 べき集合の要素(それぞれが部分集合)が半順序の性質を持ち、その中でも特別の性質を持つ束であることは、この記事(順序集合と束)とこの記事(部分集合の束のグラフ表現)で書いた。 部分集合の関係がグラフに…

SNPの2値性と包除原理(集合論・組合せ論)

包除原理 Wikipediaの記事はこちら 全体集合がある。 はもしくはに2分されるとする。 同様に、はもしくはに2分されるとする。 このようなときはに4分される。 包除の原理はであると言っている。 式変形により さらに、を入れ替えることにより 2分要素をk…

SNPの2値性と集合

SNPはカテゴリカルデータ 大多数のSNPは2アレルであるので、カテゴリ数2のカテゴリカルデータとしてとらえることができる。 集団でのアレル頻度がpと1-pとであるようなSNP(A,a)で、アレル(A,a)を観測するという事象の確率はである。 SNPが作るハプロタイプ…

平衡と不平衡と独立(たぶんシリーズもの)

確率論的独立性 該当するWikipediaの記事はこちら このWikipediaの記事には、対象が、「事象の集合のとき」、「確率変数のとき」、「完全加法族のとき」、が記載されていて、それぞれについての独立の条件が記載されている。かいつまんで記載するとお茶を濁…

Allelic associationのこと

Allelic associationとは、あるサンプル集合について、2箇所の多型のアレルの間に相関があることを言う。一般集団においては、連鎖不平衡による相関もあり、これはDNA上の物理的距離との関係が強い。また、集団に構造がある場合には、構造の存在によりAllel…

Multilocus LDインデックス

個人的な研究テーマに近い話しで少しだけ文献メモ。 the correlation in the haplotypic structure between two subsets of SNPs 複数のSNPを持つ領域につき、SNPを2群に分け、群別のハプロタイプ頻度から算出する 文献はこちら エントロピーの定義式を用い…

マーカーの非独立性を眼で見る

独立でない複数のマーカーについてmultiple testingをすることを考える。大きく2つのマーカー間非独立性がある(連鎖不平衡解析の場合)。ひとつは連鎖不平衡。もうひとつは集団の構造化。眼でみると、掲載図(オリジナルはこちら)。 掲載図では、マーカーがラ…

Multiallelic D’

関連記事はこちらとこちら 出典はこちら D’は、2つのSNPが作る4ハプロタイプの頻度のばらつき具合を表す数字で、 1がばらばら、0が均質、です(h1*h4-h2*h3)が0なら、ゼロ、これが大きい方 の極端なら1、です。 multiallelic D'も基本的には、0が…

ソースを書いてもらうための説明文

2SNP間の連鎖不平衡の評価値LODを算出するためのプログラムソースを書いてもらうための説明文 以前の記事(別テイスト)はこちら

アルファ版エクセルファイル

常染色体のSNPペアについて、トリオデータをもとにハプロタイプ頻度推定をし、その連鎖不平衡係数を計算することについて 先日、掲載した2つのエクセルファイル(こちらの記事)は、若干の修正をして、再アップロードした メンデルの法則を満たさないデータを…

有限観測染色体数における、D’、r^2の動き(算出値が1になる場合)

有限本数の染色体を観測した場合、母集団でのSNPのアレル頻度によらず、ある確率でLD指標のD'、r^2が1となるような観測データが得られる。D'=1となる確率、r^2=1となる確率はそれぞれ、2SNPが作る4ハプロタイプの母集団における頻度および、観測する染色…

X染色体用のペアワイズLD計算

ベータ版扱いです。ファイルはかなり重いですので、アクセスには忍耐が必要かも知れません(重いのは、EMのiteration 5000回分のところ)。 X染色体は、男に1本、女に2本ありますので、ハプロタイプ推定にあたっては、観測データにつき、女のデータは2本分…

トリオデータのペアワイズLD計算のエクセル

ベータ版扱いです。2種類にしました。 トリオのデータは、親子関係を利用して伝達ハプロタイプ・非伝達ハプロタイプを特定し、ハプロタイプ推定の精度を上げることができる。以下の2エクセルファイルは、トリオの3人の2SNPジェノタイプ情報から、両親2人…

トリオデータ用ペアワイズ連鎖不平衡指標計算用エクセル

ベータ版。HapMap公開データ検証用(予定)。 既存プログラムとの結果の検証がまだ済んでいない版になるので、使用には注意。検証が終了したら、ホームページへ以降予定。 ファイルはこちら Haploviewにおける、トリオデータの連鎖不平衡指標の算出についての…

連鎖不平衡のLODと尤度比検定

※ この記事の本体部分(Arlequinを用いた遺伝解析実習はこちら) ペアワイズLDの算出はLDブロックの基本である。論文等でもっともよく用いられるLD指標はr^2,D'である。また、Haploviewにては、それらに加えて、LODが用いられている。D',r^2については、比較的…

Haploviewに実装された諸ツールの出典

HaploviewはHapmapプロジェクトデータからのデータダウンロードに対応したSNPデータの連鎖不平衡解析ツールである。そのウェブサイトはこちら。その公開は論文化に先立ってなされていたが、その概要の論文化は2005年に入ってから(Barrett JC, Fry B, Maller …

Haploviewを用いた連鎖不平衡マッピング解析実習

こちらへ移動