3 SNPのデータ構造とそのLD,HWD

  • SNP
    • diallelic
  • 数に関すること
    • No. SNPs ns
    • No. haplotypes nh, nh=2^{ns}
    • No. genotypes, phased, ngp, ngp=\frac{nh(nh+1)}{2}
      • Homozygous types nh
      • Heterozygous types \frac{nh(nh-1)}{2}
    • No. genotypes, unphased, ngu, ngu=3^{ns}
  • LD/LE
  • Diplotype
    • アレルのペア
  • HWE/HWD
    • Diplotype頻度とSNPアレル頻度との間の独立性
  • LDの評価指標と検定指標
    • r^2,D'
      • その意味
      • カイ自乗値との関係
      • 関連検定統計量との関係
    • LOD
  • HWE検定
    • カイ自乗検定
    • 正確確率検定
    • Fixation indexとの関係
  • 3x3表としての2SNPの独立性
  • Fixation, 構造化とLDとの関係
  • LDとAllelic association
  • スライド

5 単一SNPの検定手法(2x3ケースコントロール、その他のカテゴリカル形質、量的形質、漸近近似手法・正確確率手法・パーミュテーション手法・尤度比手法、具体的な手法各論)

  • 検定の分類
    • 漸近近似
      • 漸近近似検定
      • 尤度比検定
    • 正確検定
  • 2x3分割表検定の諸相
    • 自由度2検定
    • 自由度1検定
    • Biased 検定
    • ロジスティック回帰
  • カテゴリカル形質、順序なし、順序あり
    • Kruskal-Wallis, Jonckheere-Terpstra
    • ロジスティック回帰
  • 量的形質
    • 線形回帰、対数変換
  • スライド

6 GWAS(データQC問題と対処、マルチプルテスティング問題の影響と対処、集団構造化の影響と対処、Frequentist以外の判断(ベイズ・FDR))

  • データQC
    • データQCはなぜ必要か
    • データQC総論
    • 基本がわかれば、後は、応用
  • マルチプルテスティング
    • 概論
    • 対処法
    • 集団構造化
    • 概論
    • 対処法
      • SNPひとしなみ
      • SNP個別
      • サンプル層別化
  • Non-frequentist
    • FDR ベイズ〜マルチプルテスティング対応
    • 特にサンプルサイズが大きくできないもの
  • スライド

7 GWAS後(GWASスクリーニング後のこと。バリデーション・レプリケーション、メタアナリシス、異民族解析、ファインマッピング)

  • バリデーション・レプリケーション
    • 発端研究でのバリデーションセットの重み
  • レプリケーションスタディのやりかた
    • タイプ1エラーの評価
    • パワー
    • 手法 メタアナリシス
  • 異民族のこと
    • 異民族スタディの意義、LD構造の違い
    • 民族間リスク差の有無と解釈
    • その場合のメタアナリシス
  • 責任アレルの同定
    • ファインマッピング、マーカー組み合わせ〜ハプロタイプ評価
    • サンプリングバイアスと関連ピーク
    • p値とオッズ比
    • 異民族サンプルの意義
  • 家系サンプルによるバリデーション

10 CNV(データ構造と解析手法)

  • CNVジェノタイプデータ
  • 関連検定
  • Heterogeneity検定
    • マン・ホイットニー・ウィルコクソン
    • 2群わけ
    • ロジスティック回帰
    • トレンド検定
  • HWE検定

時間配分

  • 1 遺伝概論(遺伝・遺伝子・染色体・DNA・変異・多型・交差・組み換え)
  • 2 集団遺伝学概論(集団・中立・Infinite site model・遺伝的多様性の評価・変異率・組み換え率・有効集団サイズ・Coalescent・ARG・Fixation・集団構造化・HWE/HWD・LE/LD・選択・歴史(Out-of-Africa, Founder effect, Bottleneck)
  • 3 SNPのデータ構造とそのLD,HWD
  • 4 複合遺伝性疾患とその形質分類
  • 5 単一SNPの検定手法(2x3ケースコントロール、その他のカテゴリカル形質、量的形質、漸近近似手法・正確確率手法・パーミュテーション手法・尤度比手法、具体的な手法各論)
  • 6 GWAS(データQC問題と対処、マルチプルテスティング問題の影響と対処、集団構造化の影響と対処、Frequentist以外の判断(ベイズ・FDR))
  • 7 GWAS後(GWASスクリーニング後のこと。バリデーション・レプリケーション、メタアナリシス、異民族解析、ファインマッピング)
  • 8 リスク多型の機能性・因果関係評価(分子遺伝学的側面)
  • 9 SNP-LD mapping、上記ルーチンのその先(フェノタイプネットワーク、パスウェイ解析、遺伝子組み合わせ)
  • 10 CNV(データ構造と解析手法)
  • 11 結語

  • 1+2+3で2ユニット(3時間)
  • 4+5で2ユニット
  • 6+7で2ユニット
  • 8+9+10で2ユニット くらいか。
  • 1+2で4ユニット(6時間)
  • 3で2ユニット(3時間)
  • 4+5で2ユニット(3時間)
  • 6で1ユニット(1.5時間)
  • 7で1ユニット(1.5時間)
  • 8+9で2ユニット(3時間)
  • 10で1ユニット(1.5時間)

くらいのようだ。13ユニット。半年、週1こまくらいは必要。