- フローサイトメーターデータの解析概説(こちら)
- 生データ→データの質チェック→正規化→外れ値の除去→自動ゲーティング→クラスター→ラベル付け→特徴抽出→解釈
- 既存の方法の分類
- 分類するための尺度
- 外れ値除去法
- 自動ゲーティング法
- Supervised/Unsupervised
- Dimension
- Multidimensional
- Non-multidimensional
- Clustering
- ラべリング法
- 解釈法
- 多次元フローサイトメーター自動コールに関する論文(こちら)→アプリケーション(FLAME)
- 尖っていて裾野の厚い分布が複数集まったものとみなしてデータ点を説明する
- そのような分布の例として、skew t-分布(これがデフォルト)
- skew t distributionはRならばsnパッケージの dst(),pst(),qst(),rst()、または、skewtパッケージのdskt(),pskt(),qskt(),rskt()
- Unspervisedな複数分布推定
- 群数の推定・群の確定
- 個々の細胞を群に割り付ける
- 個々の分布を表すパラメタの推定
- 意味づけ
- ちなみにMultivariate skew t-distributionというのもある
- たとえば(こちら)
- sn()パッケージならdmst(),pmst(),rmst()
- skew t-distributionはこんな形
library(skewt)
dskt(0.5,2)
dskt(0.01,2,2)
pskt(1.25,2,2)
pskt(c(0.5,1.25),3)
qskt(c(0,0.025,0.25,0.5,0.75,0.975,1),2,2)
rskt(100,2,2)
plot(function(x)dskt(x,2,2),-3,3)
- 別の手法関連論文
- "Modal gating"(より高密度のところを囲みこむ)方法で「ヒトだったらどうするだろうか」をなるべく模倣できるように工夫された方法
- 密度の勾配を考慮して"Negative curvature"を基準に括る
- そこに凸包を作る
- その凸包を外側に広げる
- 広げた凸包の内部だけでkernel densityを計算する
- kernel density estimate の等高線を括りにする
- その他
- フローサイトメーターのデータを扱っているRのパッケージ(「見せる」ことを主眼にしたパッケージのその附属データ)(latticeExtraパッケージ(こちら))
- Bioconductorの解析パッケージ
- 有料アプリ FlowJo