どこで区切りたいのか(診断基準をデータ処理的に一般化する)

  • (昨日)は、関節リウマチの多関節炎・対称性関節炎という特徴が、相互にどういう関係にあるかということをとっかかりに、ポアッソン分布を少しいじった
  • 少し進めてみるとともに、一般化することとする
  • ある個人tは関節リウマチという病的全身状態にある
    • 右と左に炎症関節をそれぞれn_{t,1},n_{t,2}個持つとする
    • 今、「左右」には特に意味がないとする
    • このときn_{t,1}+n_{t,2}が炎症関節総数であって、その値は0であることは少なく(関節外症状先行型で関節炎未顕段階など)、複数の関節が炎症を持つことが多い。その数は当然離散的で、数えられる程度の値であり、多すぎない値が現実的なので、このn_{t,1}+n_{t,2}はポアッソン分布に従って、その平均値は、2、3、4など、その位とみなしてよいのではないだろうか。実際には、「平均値」を統計的に知ることももちろんできる
    • 多関節炎かどうかの判断はn_{t,1}+n_{t,2} \ge 2と数式ではあらわされる
    • それでは、対称性関節炎はどうなるだろうか。min(n_{t,1},n_{t,2}) \ge 1となる。
    • 対称性関節炎条件は、明らかに、多関節炎条件よりも厳しい条件で、それは、対称性関節炎条件は多関節炎条件に含まれるとも言い換えられる。
  • これをもう少し一般化しよう
    • k個の群がある。リウマチの場合には、右と左の2群だったものとする
    • それぞれの群は、0,1,2,...,という離散的な量的値をとるものとする。リウマチの例では、これが、右(もしくは)左の炎症性関節数に相当する。
    • このようなとき、個人tの状態はN_t=\{n_{t,1},n_{t,2},...,n_{t,k}\}という長さkのベクトルによってあらわされる
    • ここで、●かそうでないかという2分診断をすることを考える
    • それは、k次元空間を2つの部分空間に分ける面を定義することである
    • リウマチの多関節炎定義や対称性関節炎定義を、このk次元空間に持ち込んで、さらに、閾値についても一般化することとする
    • 多関節炎定義の一般化
      • \sum_{i=1}^k n_{t,i} \ge KK閾値。多関節炎の場合はK=2
    • 対称性関節炎定義の一般化
      • \forall\;i n_{t,i} \ge K (対称性の場合はK=1)
      • 逆もあって\exists i \;n_{t,i} \ge Kは容易に考えられるもの
      • さらに、「すべての」「ひとつでも」をもう少し、量的に扱えば、「k個のうち、l個のiにあって、n_{t,i} \ge Kであり残りのk-l個のiでは[tex:n_{t,i}
    • そのほかには、適当にどうにでも区切りを考えて入れることができる