EM

CNV多型をはじめとする多(3以上)アレルのHWE検定 3

ディプロイドのコピー数多型が染色体別に決定されたとして、観測サンプルのコピー数別アレル数を確定的に算出し、それをもとに期待度数を算出し、観測度数と比較してカイ自乗検定をする場合と、ディプロイドの保有コピー総数のみが観測されて、それに基づい…

CNVのDiploidコピー数情報から、コピー数アレル頻度をEMで推定する

ここ数日、Copy numer variationデータのケースコントロール解析処理についての覚書を続けている。昨日、CNVジェノタイプは、2本の染色体のコピー数の和として観測されることが多いこと、その情報から集団のコピー数頻度をEMアルゴリズムで推定すること、そ…

CNV多型をはじめとする多(3以上)アレルのHWE検定と関連検定 2

最大でなるコピー数アレルを有するCNVを考える。 集団内に実在するか否かは考慮せず、コピー数がの種類のアレルが存在するものとする。 アレル数はである。 ディプロタイプを考える。 2アレルを区別して特定するようなジェノタイプ(ジェノタイプx)は種類あ…

最尤推定

先日、EMアルゴリズムによるハプロタイプ頻度推定が、その初期値設定に依存して、異なる解に収束することを例示した。(記事はこちら) その様子をプロットで示すとこのようになる。 エクセルはブルーのセルに2SNP、9ジェノタイプの人数を入れる。ハプロタイ…

EMの初期値と収束

EMアルゴリズムは、その簡単なアルゴリズムにも関わらず、最大尤度を与える推定値への収束が知られている。 しかしながら、離散分布においては、特に周辺分布(ハプロタイプ頻度ならば、ゼロに近い 頻度)において、収束速度の低下や、極大尤度への収束が起き…

アルファ版エクセルファイル

常染色体のSNPペアについて、トリオデータをもとにハプロタイプ頻度推定をし、その連鎖不平衡係数を計算することについて 先日、掲載した2つのエクセルファイル(こちらの記事)は、若干の修正をして、再アップロードした メンデルの法則を満たさないデータを…