2008-07-01から1ヶ月間の記事一覧

特異値分解

特異値分解 singular value decomposition というMの分解のこと。ただし、は対角成分以外がゼロで、対角成分は非負。はユニタリ行列。 特異値分解をするには、Rにはsvd関数がある。 > mtest<-matrix(c(1,2,3,4,5,6),ncol=2) > mtest [,1] [,2] [1,] 1 4 [2,…

行列の特異値分解

リンク

こちら

Renyiエントロピー

Wiki

集計

多数の因子があるとする。それらは、カテゴリカルな因子である。サンプルについて、それぞれの因子について観測されたデータが得られるとする。 何かの都合で、これらを複合カテゴリ(因子1のカテゴリがxで因子2のそれがyで・・・というのを弁別して個別…

時間配分

1 遺伝概論(遺伝・遺伝子・染色体・DNA・変異・多型・交差・組み換え) 2 集団遺伝学概論(集団・中立・Infinite site model・遺伝的多様性の評価・変異率・組み換え率・有効集団サイズ・Coalescent・ARG・Fixation・集団構造化・HWE/HWD・LE/LD・選択・歴史…

11 結語(自分のデータといかに向き合うか)

スライド

10 CNV(データ構造と解析手法)

CNVジェノタイプデータ 関連検定 Heterogeneity検定 マン・ホイットニー・ウィルコクソン 2群わけ ロジスティック回帰 トレンド検定 HWE検定 ハンドアウト

9 SNP-LD mapping、上記ルーチンのその先(フェノタイプネットワーク、パスウェイ解析、遺伝子組み合わせ、前向き)

8 リスク多型の機能性・因果関係評価(分子遺伝学的側面)

分子遺伝学おさらい 多型と分子遺伝学・分子レベルのアレル特異性 関連と因果 スライド

7 GWAS後(GWASスクリーニング後のこと。バリデーション・レプリケーション、メタアナリシス、異民族解析、ファインマッピング)

バリデーション・レプリケーション 発端研究でのバリデーションセットの重み レプリケーションスタディのやりかた タイプ1エラーの評価 パワー 手法 メタアナリシス 異民族のこと 異民族スタディの意義、LD構造の違い 民族間リスク差の有無と解釈 その場…

6 GWAS(データQC問題と対処、マルチプルテスティング問題の影響と対処、集団構造化の影響と対処、Frequentist以外の判断(ベイズ・FDR))

データQC データQCはなぜ必要か データQC総論 基本がわかれば、後は、応用 マルチプルテスティング 概論 対処法 集団構造化 概論 対処法 SNPひとしなみ SNP個別 サンプル層別化 Non-frequentist FDR ベイズ〜マルチプルテスティング対応 特にサ…

5 単一SNPの検定手法(2x3ケースコントロール、その他のカテゴリカル形質、量的形質、漸近近似手法・正確確率手法・パーミュテーション手法・尤度比手法、具体的な手法各論)

検定の分類 漸近近似 漸近近似検定 尤度比検定 正確検定 2x3分割表検定の諸相 自由度2検定 自由度1検定 Biased 検定 ロジスティック回帰 カテゴリカル形質、順序なし、順序あり Kruskal-Wallis, Jonckheere-Terpstra ロジスティック回帰 量的形質 線形回帰…

4 複合遺伝性疾患とその形質分類

スライド

3 SNPのデータ構造とそのLD,HWD

SNP diallelic 数に関すること No. SNPs ns No. haplotypes nh, No. genotypes, phased, ngp, Homozygous types Heterozygous types No. genotypes, unphased, ngu, LD/LE ハプロタイプ頻度とSNPアレル頻度との間の独立性 Diplotype アレルのペア HWE/HWD…

2 集団遺伝学概論(集団・中立・Infinite site model・遺伝的多様性の評価・変異率・組み換え率・有効集団サイズ・Coalescent・ARG・Fixation・集団構造化・HWE/HWD・LE/LD・選択・歴史(Out-of-Africa, Founder effect, Bottleneck)

スライド

1 遺伝概論(遺伝・遺伝子・染色体・DNA・変異・多型・交差・組み換え)

スライド

ぱらぱらめくるnature reviews genetics

Population genetic analysis of shotgun assemblies of genomic sequences from multiple individuals. by Hellman, I. et al., Genome Research online publication on 22 July, 2008 Nucleotide diversity selection, drift local relates local recombin…

PI-HAT

plinkツールについての概説はこちら その中で、血縁関係不明のサンプルについて、サンプルペアのIBDを推定するオプションがある。指標はPI-HAT これについては、plinkの論文(Am J Hum Genet. 2007 September; 81(3): 559–575.)の565ページからの記載を参照。…

Rで距離行列を作る

n個の要素がある。要素間に距離という値があるとする。自身から自身への距離は0であるという。要素xから要素yへの距離と要素yから要素xへの距離とは同一であるという。このような距離をnxn行列で表現したものが距離行列である。今、ペアできる。Rのape…

ちょっとメモ

public static double PrRatioChiPrExPrAllDF(double[][] d){ int df=(d.length-1)*(d[0].length-1); System.out.println("df=\t"+df+"\t"); //(ExPr/ChiPr) double ret = 1; double chi=Chi.chi(d); if(chi!=0){ double chiPr=0; double expr=0; double chi…

発現調節について調べ物

Tuning gene expression to changing environments: from rapid responses to evolutionary adaptation. Nature Reviews Genetics, advance online publication, 1 July (2008) | doi:10.1038/nrg2398 P bodies: at the crossroads of post-transcriptional …

0の多い分割表

n行m列の分割表(がある。今、第1列から、第m-1列は、第1行にのみ非0の値が入り、残りの行は0であり、第m列は、第1行の値が0で、残りの行には非0の値が入っているような、0ばかりの表があったとする。このような表のカイ自乗値はサンプル総数に一致する。 今…

rEHHの文書

Sweep Documentation

メモ

f Fst

これまでの記事でinbreeding coefficient とWright' Fstとにつきあるときはf,あるときはFst,あるときはfst,などと表記が入り組んでいた。 この記事で述べた言い換えのこともある。 inbreeding coefficientをf,Wright's Fst をFstと統一した(気がついた範囲で…