バイアス・補正・正規化等の側面、データマイニングの側面:Single-cell RNA-seqの解析

  • Nature Reviews Genetics, Computational and analytical challenges in single-cell transcriptomics 資料2
  • 定量標準を入れる
    • UMI(Unique Molecular Identifilers):個々の分子をバーコード化し、増幅バイアス影響を排除した、「オリジナルの」分子数推定をする(ペイパー)
  • 遺伝子発現定量は、シングルセルに限らず以下のステップが必要
    • アラインメント、遺伝子カウント、QC、正規化、モデル化
    • シングルセル特有のこと
      • QC
        • 細胞ごとに、実験に有効に使われるRNAの割合が上下したりする
        • 質の悪い細胞であるかどうかの判定をして排除する
      • 正規化:細胞間比較をするために必要
        • UMIsなしの場合
          • 1細胞内総体量推定はできても、細胞間の違いはわからないのが原則
        • UMIsありの場合
          • UMIsを使えれば、それを信じる限りでは、それを基準に定量できて、細胞間比較も可能
  • データマイニング
    • クラスタリング
      • 細胞タイプの推定は、いわゆるクラスタリング法でできる
      • 細胞タイプの他に、細胞周期上の情報も得られる
      • 細胞の位置情報を組み込みたいときに、さらにMarkov Random Fieldを使う方法などもある(こちら)
    • DE(Differential Expression)
    • Identification of highly varible genes
    • Regulatory networks with their robustness
    • Stochasticity of transcription
    • Allele-specific expression