Omicsデータの解析手法の概説(トランスクリプトーム)(初めてのヒトのチェック事項)

  • Omicsデータの解析手法を概説しているBioinformatics for Omics Data Methods in Molecular Biology, 2011, Volume 719, Part 1, 113-131, DOI: 10.1007/978-1-61779-027-0_5(こちら)を眺める
  • 発現解析を主なターゲットにしている
  • イントロ
    • オミックスデータの特徴
      • p>>n パラダイム(サンプル数よりマーカー数が多い)
      • 統計(検定)手法自体が新しい
      • マルチプルテスティング補正
      • 共線性の回避
      • 適切な特徴抽出
  • 対象(Materials)
    • 母集団と標本の基本的なこと
    • 統計学的検定」とは、の基礎
    • オミックスデータでの検定に特徴的なこと
      • 「個別の何か」に関する情報が得られるのではなくて、「全体の何か」についての情報が得られること(そのうえで、「個別の何か」についても何がしかの判断がなされる)
    • 統計量
      • 記述統計量と補正・QC
      • Fold change
      • t-統計量
      • Moderated t-統計量
      • 有意差の評価法
      • ノン-パラ Wilcoxon Rank-Sum
      • ノン-パラ Rank-product
    • マルチプルテスティング
      • FWER
      • FDR
    • FDRベースでの有意差判定
      • ステップワイズ
      • シミュレーション
  • Methods
    • FDRの前提
      • 全仮説の数
      • 対立仮説が真の数
      • False Positivesの許容上限数
      • 「平均の違い」(普通は『差なし』)
      • 観測ごと・サンプルごとの分散
      • 実験間の差(バイアス)・・・結構ある
    • Data preprocessing
    • Quality checks
    • Filtering
    • 「違いの評価」
    • 可視化
    • バリデーション
      • フィルタリングの違いの影響のありなしを評価
      • 検定統計量の違いの影響のありなしを評価
      • リサンプリングして再現性があるかの評価