機械に教える医学学習6 有用な情報

  • こちらの続き
  • 今、あるpが与えられたときに、Qの要素q1,...,qnのそれぞれに対して、値が算出できるとする
    • これまでの考え方から言えば、pはある症候であって、Qは診断名の集合、qiは個々の診断名であり、p、Qはグラフ状の知識体系として表現してあり、値はこのグラフ上でのpとqiとの関係から計算されるものである
    • これを知識体系Gにおけるpからqiへの値という意味で、V_G(qi | p)と書くことにする
    • qiの相対的な値としてV_G'(qi | p) = \frac{V_G(qi | p)}{\sum_{qj \in Q} V_G(qj | p)}と書くこともできるだろう
  • もし、V_G(qi | p)がqiのもとでの観察pの確率であるとすれば、この話は、確率・尤度、事前確率・事後確率の枠組みでの話となる
    • 事前確率・事後確率が出た。これは、ある情報が与えられることによって、尤もらしさが情報が与えられる前の値から情報が与えられた後の値に変わる、という話である
    • V_G(qi | p)の例で言えば、新たな情報 rが加わることでV_G(qi | p,r)に変わることだろう
    • 今、ある疾患qiに関して真偽をより正確に知りたい(除外診断したい、確定診断したい)としよう
    • それはあらたな情報rを得ることによって、V_G'(qi | p) = \frac{V_G(qi | p)}{\sum_{qj \in Q} V_G(qj | p)}V_G'(qi | p,r)に変えたときに\frac{V_G'(qi | p,r)}{V_G'(qi | p)}が有用なだけ1から離れる(大きくなれば確定診断に近づき、小さく慣れば除外診断に近づくことになる)
    • 逆に言えば、意味のある情報集合Rの要素rk \in Rに関して、\frac{V_G'(qi | p,rk)}{V_G'(qi | p)}が最もおおきくなるようなrkは、確定診断のために最も有用な情報であるという考え方もできる
    • 書き方があると便利なので、D_G(rk | (qi | p)) =\frac{V_G'(qi | p,rk)}{V_G'(qi | p)}とでも書くことにしよう
    • この表記を使えば、D_G(rk1 | (qi | p))D_G(rk2 | (qi | p))との値を比べる(比をとるとか)こともできるだろう。この比はV_G'(qi | p,rk1)V_G'(qi | p,rk2)との比に過ぎなくて、あまり面白い値ではないのであるが、たとえば、qi1を確定診断したいし、qi2を除外診断したいが、一度にできる検査は一つ、というようなときにはD_G(rk1 | (qi1 | p))D_G(rk2 | (qi2 | p))を比較することになり、D_Gを使う意味が出てきそうである