集団遺伝学

Allele-sharing distance

表題の用語について質問を受けた。 集団間の遺伝的な距離を表す指標のひとつである。 今、ある多型ローカスがあったとき、2集団間にその多型ローカスの"Allele-sharing distance"が定義される。複数のローカスを用いて、"Allele-sharing distance"を定義す…

3 多アレルの場合

上記記事は、2アレルの場合であった。p,(1-p)というアレル頻度の状態から遺伝的浮動の結果、どちらか片方のアレルに固定される確率過程を扱ったということである。 2アレルでない場合もある。遺伝的浮動は、「存在していたアレルがついに消滅すること」で…

2 中立な多型の遺伝的浮動と拡散方程式

拡散方程式は次のようになる。ただし、Nは集団の大きさ 、ただし、xは0より大、1より小 この拡散方程式の厳密解 ただし、は超幾何関数(これについてはこちら) 超幾何関数は、この記事にもあるように、無限個の項の和で定義されるが、実は、のが効いていて、i…

1 拡散方程式で表す遺伝的浮動

遺伝的浮動とは:記事はこちら 拡散方程式 物理現象・熱力学現象を既述するのに、偏微分方程式が用いられる 拡散方程式は、時間に関する偏微分と空間に関する2階偏微分(と1階偏微分との和)が比例するという方程式で、拡散現象や熱の振る舞いを記述できる …

集団遺伝学講義のサイト紹介

アリゾナ大学分子進化学コース(Dr. Bruce Walsh)のウェブサイトにいくつか、R関係のメモあり。尤度・尤度比検定、MCMC、Gibbsなどに関する諸文書へのリンクもあり。 Dr. Bruce Walsh ホームページトップ Biostatistics関係のトップ Rによる確率分布やP値の計…

Structured AssociationとGenomic Control

Structured Association 複数の互いに位置的に関連のない遺伝マーカーにおける観測データを用いて、個人を複数の亜集団に分類する。それぞれの亜集団は階層化がないものとする。亜集団にわけた上で解析をすることで、個々のマーカー・ローカスにおける統計量…

集団階層化

集団から抽出して行うケース・コントロール関連解析は、そのサンプル収集の容易さからCommon diseases関連遺伝子解析の主流となっている。大規模な連鎖不平衡関連解析では、解析遺伝子・ローカスの数が多いことからくる第1種過誤のインフレーションが問題と…

Population subdivision と (FST), AMOVA

清書版 Fixation indexとの計算・検証のためのエクセルファイルはこちら(作成:京都大学医学研究科附属ゲノム医学センター、協力:理化学研究所遺伝子多型研究センター関節リウマチ関連遺伝子研究チーム、使用にあたっては、こちらに準ずる) Population subd…

ANOVA (Analysis Of VAriance) と AMOVA (Analysis of MOlecular VAriance)(Population subdivisionにおける)

ANOVA(ANalysis Of VAriance) (分散分析) 基本的な統計手法の一つであり、そのすべてをここで説明することは不適切であるが、簡潔に述べると次の通り 複数(3以上)の母集団を比較し、その平均値が等しいという仮定を検定するのがANOVA(analysis of variance…

Wright’s F-statistics,hierarchic subdivisions(Population subdivisionにおける)

の3つからなる統計量である。 亜集団間の関係を表しているのは、そのうちのになる。以下ではを中心に述べる。 HWE検定(関連記事はこちら)、Fixation index(関連記事はこちら)では、ある集団の内部構造を検討していた。そこに存在する全個体のアレルの分布に…

Fixation index F(Population subdivisionにおける)

次の仮説に基づく、Fixationの指標(subdivisionの指標とも言える) ランダムメイティング集団ではHWEが成り立っている。Subdivisionが起きると、Subdivided亜集団内ではHWEが成り立つが、遺伝的浮動のため、亜集団のアレル頻度に差が生じる。極端な場合には、…

Hardy-Weinberg平衡検定(Population subdivisionにおける)

本来はPopulation subdivisionの検定ではないが、SNP解析出身者にはもっとも理解が容易な指標なので、はじめに説明する HWE検定でHWEが棄却された場合には、Heterozygosityの過少の場合には、subdivisionの存在がその理由である可能性がある(が、そうと断定…

Population subdivision と (FST), AMOVA

この記事は自分用として非公開。全体の構成に不備があり、自分以外には不適切な内容が多いものの、備忘録としての役割が大きいので、閲覧不能状態で残す。 ここにあった記事の修正・清書版は→こちらに移動しました。

HomozygosityとHeterozygosity

クローン集団でなければ、集団中に多様性が存在する。Diploid個体の集団を取り扱う場合、多様性の指標のひとつとして、集団中の個体のうちホモの個体の占める割合(Homozygosity)とヘテロの個体の占める割合(Heterozygosity)とをよく用いる。 Homozygosity + …

遺伝的浮動(Drift)

集団中にの多様性の素である変異はたえず起きているが、そのうちの大多数は集団中に残ることなく消滅する。理由は、変異配列染色体が次世代集団にかならずしも引き継がれないためである。簡単のために、100染色体があって、次世代も人口増加はなく100染色体…

Infinite-sites model

Infinite-alleles modelでは、たとえば、次のような2つの変異をモデルに合致した変異とみなす。ATGC->AAGC, ATGC->AGGC。2つの変異は、それぞれ新規アレルを生んでいる。 Infinite-sites modelでは、塩基配列は非常に長いので、あるDNA部位には、1度しか…

Infinite-alleles model

変異が起きて、遺伝子の多様性が増すことを考える。細かく考えると、あるとき、ある染色体に変異が起きてアレルが生まれ、別のときに別の染色体に変異が起きてアレルが生まれたとしたときに、この2つの新たに生まれたアレルは、同一かもしれない。しかしな…

第7限 Genetic structure

集団は、均一集団の寄せ集めになっている(ことが多い)。そのよせ集まり具合の評価。最近、論文でよく使われている"Structure"はこちら。Structureでは、観測データから個人をグループ分けして、グループ間の遠近関係を出す。こちらの手法は、観測データとと…

第5限 連鎖不平衡判定と連鎖不平衡係数の計算

Arlequinの連鎖不平衡解析は遅いので原則、用いない。しかしながら、出力が丁寧なので、原理の学習という意味で連鎖不平衡のみなぞる。 EMアルゴリズムにてハプロタイプ頻度を推定し、それに基づいて連鎖不平衡の検定、および連鎖不平衡係数を計算している …

第3限 配列の違いの評価(Diversity indices)

サンプルデータ 2群(GroupA,GroupB)について、全6SNPが作るハプロタイプが観測された。GroupAでは102人=204本、GroupBでは69人=138本。GroupAには7種類のハプロタイプが認められ、A1...A7と名前をつけた。それぞれの観測本数は、98,52,...3,1本ずつである…

第6限 Neutralityテスト

分子進化の中立仮説にもとづいたモデルからの予想値と実測データの乖離の程度を評価するのが、Neutralityテストである。テストは、実測データのあるものの分布が、モデルにからの予想の分布との差について検定することにより行われる。アレルに関する分布を…

第2限 入力ファイルと全解析に共通する設定

Arlequinの入力ファイルフォーマット・出力フォーマットは大量データのコマンドラインを意識したつくりになっていないので、そのつもりで。 SNP解析を前提にする。それ以外の場合は、SNP解析での経験をもとに、マニュアルを参照のこと。データを構成する基幹…

第1限 インストールと起動、設定

以下にはWindows XPにおけるインストール。Mac,Linuxへのインストールについては、オフィシャルページの解説を適宜参考にすること ホームページ ダウンロード bin + jre版"Arlequin20jre_zip.exe"をダウンロードし、ダブルクリック。解凍されて現れる2つの.…

第4限 Haplotypic dataとGenotypic data、そのGametic phase既知と未知

第3限にて、Haplotypic dataを用いて、Diversity indicesの解析とその結果の解釈を行った。第4限では、Genotypic dataに拡張する。 !注意! Diversity indicesのうち、Standard diversity、および、Theta(Hom)はhaplotypic dataとPhase既知のGenotypic da…

Arlequinを用いた遺伝解析実習

全7限 このシリーズでの取り扱い範囲 遺伝子(もしくは、ある領域)の遺伝的多様性の評価(記事はこちら) Heterozygosity、ハプロタイプ間距離、ハプロタイプ関係樹・ハプロタイプ関係ネットワーク、Mismatch distribution、ハプロタイプ頻度推定 連鎖不平衡の…

Exact tests of population differentiation

r集団にkジェノタイプが観測されたときに、その分布がランダムであるとする帰無仮説を棄却する程度を検定する。2x2分割表検定に対するFisher's exactテストのrxk分割表への拡張と同様である。全組み合わせを完全に計算する代わりに、(Arlequinパッケージでは…

第3限 補助資料 Diversity indices出力例

//////////////////////////////////////////////////////////////////// RUN NUMBER 1 (16/12/05 at 18:19:34) //////////////////////////////////////////////////////////////////// Project information: