UCSC Genome Browserへリンクしてゲノムデータを管理してみる

リテラシーツール

自己ゲノムデータをパブリックゲノムデータとリンクしてブラウズしたりするには、Generic Genome Browser GBrowse(こちら)などを利用することも可能だが、より簡便には、UCSC BioinformaticsグループのGenome Browser(サイトはこちら)のカスタムトラック機能…

2005-12-28

第６限　タグSNPの選定

遺伝統計学実習 Haploview

タグSNPとは、ある領域にに多数の多型が存在し、それらすべてを解析する代わりに、その領域の単一SNP関連解析・ハプロタイプ関連解析を効率よく行うために選ばれるSNPのセットのことである。弁別したいハプロタイプのセットとタグ化による関連解析精度の劣化…

2005-12-28

第５限　連鎖不平衡ブロック内ハプロタイプの推定

遺伝統計学実習 Haploview

EMアルゴリズムはすべてのハプロタイプフェージングの基礎であるので、原理を了解すること。そのためには、ジェノタイプデータを変えてそれに対するEMの出力を確認することが望ましい。EMについての記事はこちら。それを踏まえて、２SNP、３SNP、４SNPにつき…

2005-12-28

第２限　個々のSNPジェノタイプデータの評価

遺伝統計学実習 Haploview

個々のSNPについて、ケース・コントロール別にジェノタイプ観測人数がカウントされ、その結果、homo,hetero,counter-homo,unknownの４コール x 2サンプル群の８数が得られる。ケース・コントロール関連解析を行う前提有効コール率・不明コール率の確認ケ…

2005-12-28

第１限　インストールと起動、ケース・コントロール入力ファイルの作成

遺伝統計学実習 Haploview

Haploviewホームページ Haploviewダウンロードサイト Javaアプリケーションを動かすためにJREが入っていなければ、Java.comからダウンロードその後、HaploviewをOSに合わせて、ダウンロードし、必要に応じて、自己解等式ファイルを実行してインストールする…

2005-12-28

Haploviewを用いた連鎖不平衡マッピング実習

遺伝統計学実習 Haploview tag SNP

全９限このシリーズでの取り扱い範囲個々のSNPジェノタイプデータの評価(HWE検定)(記事はこちら) SNP-SNPペア間の連鎖不平衡の評価(記事はこちら) 領域の連鎖不平衡の評価と連鎖不平衡ブロックの作成(記事はこちら) 連鎖不平衡ブロック内ハプロタイプの推…

2005-12-28

第９限　ケース・コントロール関連検定・多点解析補正

遺伝統計学実習 Haploview 疾患感受性遺伝子解析関連解析

今、２つのSNP(SNP_A,SNP_B)があるとする。次の４つの場合を考える (1)SNP_AとSNP_Bとは異なる染色体上にある(連鎖不平衡には(絶対に)ない、SNP_AのジェノタイプがわかってもSNP_Bのジェノタイプが何であるか、予想ができない) (2)SNP_AとSNP_Bとは、同じ遺…

2005-12-28

第８限　ケース・コントロール関連検定・ブロックハプロタイプでの関連検定

遺伝統計学実習 Haploview 疾患感受性遺伝子解析関連解析

ハプロタイプの関連検定は、haplo.statsなどもこのブログで紹介(記事はこちら)しているが、定番が(まだ)ない（ハプロタイプでの関連検定の手法のいくつかについての概説記事はこちら)。その主な理由は次の通り領域ごとにハプロタイプ種類(アレル)数が異なり…

2005-12-28

第７限　ケース・コントロール関連検定・単一SNPでの関連検定

遺伝統計学実習 Haploview 疾患感受性遺伝子解析関連解析

ローカスの強さの指標とその検定-他のデータ解析・検定と同様に、「強さ」と「統計的有意差」からなる「強さ」も「統計的有意差」も算出する方法はある。問題は、何を比較したいか(何を比較しないか)を了解してから実行することである関連範囲の絞込みにお…

2005-12-28

第３限　SNP-SNPペア間の連鎖不平衡の評価

遺伝統計学実習 Haploview

２マーカー間の連鎖不平衡関係を評価するとは、２マーカーが作るハプロタイプ(SNP２個の場合は４ハプロタイプ)の頻度の分布をもとに、「連鎖不平衡の程度」を「量」で表す方法と、「連鎖不平衡」の存在を「質(検定)」で表す方法とに分かれるいずれも、ハプ…

2005-12-28

第４限　領域の連鎖不平衡の評価と連鎖不平衡ブロックの作成

遺伝統計学実習 Haploview

あるマーカーとあるマーカーの間の連鎖不平衡の強さは、そのマーカー間におきた組み換えの多寡を反映している。組み換えは、マーカー間の距離と、その２マーカーが共存した時間とに影響を受ける。近接するマーカーよりも互いに遠距離にあるマーカー間の方が…

2005-12-26

Population subdivision と (FST), AMOVA

集団遺伝学 AMOVA

清書版 Fixation indexとの計算・検証のためのエクセルファイルはこちら(作成：京都大学医学研究科附属ゲノム医学センター、協力：理化学研究所遺伝子多型研究センター関節リウマチ関連遺伝子研究チーム、使用にあたっては、こちらに準ずる) Population subd…

2005-12-26

ANOVA (Analysis Of VAriance) と AMOVA (Analysis of MOlecular VAriance)(Population subdivisionにおける)

集団遺伝学 Glossary

ANOVA(ANalysis Of VAriance) (分散分析) 基本的な統計手法の一つであり、そのすべてをここで説明することは不適切であるが、簡潔に述べると次の通り複数(３以上)の母集団を比較し、その平均値が等しいという仮定を検定するのがANOVA(analysis of variance…

2005-12-26

Wright’s F-statistics,hierarchic subdivisions(Population subdivisionにおける)

集団遺伝学 Glossary

の３つからなる統計量である。亜集団間の関係を表しているのは、そのうちのになる。以下ではを中心に述べる。 HWE検定(関連記事はこちら)、Fixation index(関連記事はこちら)では、ある集団の内部構造を検討していた。そこに存在する全個体のアレルの分布に…

2005-12-26

Fixation index F(Population subdivisionにおける)

集団遺伝学 Glossary

次の仮説に基づく、Fixationの指標(subdivisionの指標とも言える) ランダムメイティング集団ではHWEが成り立っている。Subdivisionが起きると、Subdivided亜集団内ではHWEが成り立つが、遺伝的浮動のため、亜集団のアレル頻度に差が生じる。極端な場合には、…

2005-12-26

Hardy-Weinberg平衡検定(Population subdivisionにおける)

集団遺伝学 Glossary

本来はPopulation subdivisionの検定ではないが、SNP解析出身者にはもっとも理解が容易な指標なので、はじめに説明する HWE検定でHWEが棄却された場合には、Heterozygosityの過少の場合には、subdivisionの存在がその理由である可能性がある(が、そうと断定…

2005-12-21

Population subdivision と (FST), AMOVA

集団遺伝学 AMOVA

この記事は自分用として非公開。全体の構成に不備があり、自分以外には不適切な内容が多いものの、備忘録としての役割が大きいので、閲覧不能状態で残す。ここにあった記事の修正・清書版は→こちらに移動しました。

2005-12-19

HomozygosityとHeterozygosity

集団遺伝学 Glossary

クローン集団でなければ、集団中に多様性が存在する。Diploid個体の集団を取り扱う場合、多様性の指標のひとつとして、集団中の個体のうちホモの個体の占める割合(Homozygosity)とヘテロの個体の占める割合(Heterozygosity)とをよく用いる。 Homozygosity + …

2005-12-19

遺伝的浮動(Drift)

集団遺伝学 Glossary 遺伝的浮動

集団中にの多様性の素である変異はたえず起きているが、そのうちの大多数は集団中に残ることなく消滅する。理由は、変異配列染色体が次世代集団にかならずしも引き継がれないためである。簡単のために、100染色体があって、次世代も人口増加はなく100染色体…

2005-12-19

Infinite-sites model

集団遺伝学 Glossary

Infinite-alleles modelでは、たとえば、次のような２つの変異をモデルに合致した変異とみなす。ATGC->AAGC, ATGC->AGGC。２つの変異は、それぞれ新規アレルを生んでいる。 Infinite-sites modelでは、塩基配列は非常に長いので、あるDNA部位には、１度しか…

2005-12-19

Infinite-alleles model

集団遺伝学 Glossary

変異が起きて、遺伝子の多様性が増すことを考える。細かく考えると、あるとき、ある染色体に変異が起きてアレルが生まれ、別のときに別の染色体に変異が起きてアレルが生まれたとしたときに、この２つの新たに生まれたアレルは、同一かもしれない。しかしな…

2005-12-19

■

2005-12-18

連鎖不平衡のLODと尤度比検定

連鎖不平衡アプリケーション Haploview Arlequin

※ この記事の本体部分(Arlequinを用いた遺伝解析実習はこちら) ペアワイズLDの算出はLDブロックの基本である。論文等でもっともよく用いられるLD指標はr^2,D'である。また、Haploviewにては、それらに加えて、LODが用いられている。D',r^2については、比較的…

2005-12-17

樹の描図

系統樹アプリケーション TreeView

フリーアプリケーションTreeViewをダウンロードしよう(URL) 樹の構造をテキスト表現する方法もいくつかあるが、 (B1:0, (((B3:0, B5:2.00000):0, B2:1.00000):0, B4:0.00000):1.00000); は、Newick書式(URL)と呼ばれ、樹を描くアプリケーションの複数で用い…

2005-12-16

第７限　Genetic structure

集団遺伝学実習 Arlequin 構造化

集団は、均一集団の寄せ集めになっている(ことが多い)。そのよせ集まり具合の評価。最近、論文でよく使われている"Structure"はこちら。Structureでは、観測データから個人をグループ分けして、グループ間の遠近関係を出す。こちらの手法は、観測データとと…

2005-12-16

第５限　連鎖不平衡判定と連鎖不平衡係数の計算

集団遺伝学実習 Arlequin

Arlequinの連鎖不平衡解析は遅いので原則、用いない。しかしながら、出力が丁寧なので、原理の学習という意味で連鎖不平衡のみなぞる。 EMアルゴリズムにてハプロタイプ頻度を推定し、それに基づいて連鎖不平衡の検定、および連鎖不平衡係数を計算している …

2005-12-16

第３限　配列の違いの評価(Diversity indices)

集団遺伝学実習 Arlequin

サンプルデータ２群(GroupA,GroupB)について、全６SNPが作るハプロタイプが観測された。GroupAでは102人=204本、GroupBでは69人=138本。GroupAには７種類のハプロタイプが認められ、A1...A7と名前をつけた。それぞれの観測本数は、98,52,...3,1本ずつである…