死因統計

  • 昨日死因統計を取るために死因に関するカスケード情報から「死の起因」を引き出す話を書いた
  • ルールなので、文字列情報の計算機処理に落とせてなんぼだろう
  • 一般原則
    • 起因は下の行に記載されている
      • この実装は簡単
  • ルール1
    • 複数の疾患が1行に収まっているときの選択
      • 入力値が複数の情報からなってるかどうか
        • 形態素解析でやってもよいだろうし、「登録済み用語」は(多いとはいえ)限定的なので、そのひとつへの一致でとりだすこともかなり簡単
      • (順序がある場合)
        • 順序はすべての用語について順序を入れることも可能だろうから、それを用いた選別順序も簡単だろう
  • ルール2
    • 複数の疾患が1行に収まっているときの選択
        • 同上
      • (順序がない場合)
        • 順序がなければ最初を採用、という単純ルールなので実装は簡単
  • ルール3
    • II欄に誤って起因が書かれていることもある
      • I欄の範囲で選ばれた起因とII欄とのそれを比べて、どちらを採用するべきかのルール付も単純
  • ルールA
    • 上位ルールの例外規定
      • 例外規定は、「例外の列挙」で済む
  • ルールB
    • 下に書かれている病名が、死亡にかかわるというより、「きっかけ」を提供しているだけ
      • 「因果関係」か「きっかけ」かとはどういう違いかを列挙形式で教えることは可能
  • ルールC
    • 死因コードとして特に起因を意識して指定してある
      • 特定してある用語との一致の実装
  • ルールD
    • 特異性を担保する
      • 「特異性」という属性を用語に与え、その順序で比較する、という実装
  • ルールE
    • 病気が時期によって異なる場合
      • 疾患名同士に時期対応があるかどうかも教えることは可能
  • ルールF
    • 死因コードとして特に起因を意識して指定してある
      • 特定の指定用語の登録も可能