多次元FACS自動コール

  • フローサイトメーターデータの解析概説(こちら)
    • 生データ→データの質チェック→正規化→外れ値の除去→自動ゲーティング→クラスター→ラベル付け→特徴抽出→解釈
    • 既存の方法の分類
      • 分類するための尺度
        • 外れ値除去法
          • 分布利用
          • 距離利用
        • 自動ゲーティング法
          • Supervised/Unsupervised
            • Supervised
            • Unsupervised
          • Dimension
            • Multidimensional
            • Non-multidimensional
          • Clustering
        • ラべリング法
        • 解釈法
  • 多次元フローサイトメーター自動コールに関する論文(こちら)→アプリケーション(FLAME)
    • 尖っていて裾野の厚い分布が複数集まったものとみなしてデータ点を説明する
      • そのような分布の例として、skew t-分布(これがデフォルト)
        • skew t distributionはRならばsnパッケージの dst(),pst(),qst(),rst()、または、skewtパッケージのdskt(),pskt(),qskt(),rskt()
      • Unspervisedな複数分布推定
      • 群数の推定・群の確定
      • 個々の細胞を群に割り付ける
      • 個々の分布を表すパラメタの推定
      • 意味づけ
        • ちなみにMultivariate skew t-distributionというのもある
          • たとえば(こちら)
          • sn()パッケージならdmst(),pmst(),rmst()
    • skew t-distributionはこんな形

library(skewt)
dskt(0.5,2)
dskt(0.01,2,2)
pskt(1.25,2,2)
pskt(c(0.5,1.25),3)
qskt(c(0,0.025,0.25,0.5,0.75,0.975,1),2,2)
rskt(100,2,2)
plot(function(x)dskt(x,2,2),-3,3)
  • 別の手法関連論文
    • "Modal gating"(より高密度のところを囲みこむ)方法で「ヒトだったらどうするだろうか」をなるべく模倣できるように工夫された方法
    • 密度の勾配を考慮して"Negative curvature"を基準に括る
    • そこに凸包を作る
    • その凸包を外側に広げる
    • 広げた凸包の内部だけでkernel densityを計算する
    • kernel density estimate の等高線を括りにする
  • その他