カテゴリ分類

  • こちらでフローサイトメトリーデータの木構造クラスタリング・視覚化の話を書いた
  • マルチマーカー・フローサイトメトリーで血球の分化を木構造化するはなし
  • 一般に免疫学で血球をフローサイトメトリー解析するときには、n種のマーカーの発現パターンをバイナリで考えて2^n通りに分類して考える(ことが多い)
  • この2^n分割は疎で、存在する格子点がまばらにあると考えることが、マーカー数が多い場合には適当
  • そのうえで格子点ごとに「名称」をつけて特異的な意味を持たせる(持たせようとする)ことが多いだろう
  • その作業自体は、「格子点」にはそれ特異的な機能がある、という立場にたっているというように説明することもできるし、格子点をその位置の情報をとっぱらって、2^nの相互に対等なカテゴリとして扱う、というように説明することができる
  • 格子点の座標を考慮して解析するとそれは、n個の変数を使って何かしらの機能との関係を調べることになる。n個の変数の間の関係をモデルに組み込まなければ、n変数の回帰であるし、もし線形モデルにするなら、かなり単純
  • ただし、それでは免疫細胞の機能がうまく説明できるようにはまったく見えないので、そうでないやり方がなされている
  • そのやり方は、というと:2^n通りのフラットなカテゴリに分解して、1 : (2^n-1)で何かしら特異的な機能とリンクしていないか…と探す作業である
  • 2^n。これは、n個の因子を\begin{pmatrix}n\\2\end{pmatrix},\begin{pmatrix}n\\3\end{pmatrix},...,\begin{pmatrix}n\\n\end{pmatrix}のすべてを考慮するフルモデル
  • それで見えてくることもあるだろう。ただし、何か関連のある機能がみつからないかなーというスタンスで、これをやり始めると、マルチプルテスティングの問題に突き当たる
  • 2^nの格子点のすべてが埋まっているわけではないので、ここまでひどくはならないのだが
  • せっかく木構造が入ったので、それを使うのが得策に見えるが…、さて、どうするか