検定・回帰の側面:Single-cell RNA-seqの解析

  • Survey and Summary, Single-cell RNA-seq: advances and future challenges 資料1
    • 紙幅の多くは1細胞のRNAをきちんと回収し、きちんと読むこと、由来細胞をきちんと区別すること(バーコード・ラベル)など、リード産生プロセスに関すること
    • Cell-to-cell variability
    • データ解析的に2は、コピー数の少なさとそれを細胞の発現状態に特徴づけることの難しさにある。ただし、その統計学的記述はほとんどない(Bimodality in expression
    • 10^5-10^6 mRNA molecules / a cell
    • < 5 copies of coding,  < 0.5 copies of long non-coding RNAs in some species.
    • どうして2峰性になるのかに関するペイパー
    • どう解析するか
      • 2群間の違いを2峰性を考慮して解析する手法(共変量(バッチエフェクト、時刻情報など)を入れられない)Bayesian approach to single-cell DE analysis
      • 2群比較に限らない方法、バッチエフェクトなど共変量を入れられる)MAST
  • MASTではbimodalityパラメタの水愛知のためにRのarmパッケージのbayesglm()関数を使う(bayesglm)
    • 簡単に言うと、glm()と同じような回帰式を使いつつ、変数の係数推定では尤度最適化をするのにpriorからの更新手続きをする(ベイズする)
  • Empirical Bayes shrinkage