機械に教える医学学習６　有用な情報 - ryamadaの遺伝学・遺伝統計学メモ

こちらの続き
今、あるpが与えられたときに、Qの要素q1,...,qnのそれぞれに対して、値が算出できるとする
- これまでの考え方から言えば、pはある症候であって、Qは診断名の集合、qiは個々の診断名であり、p、Qはグラフ状の知識体系として表現してあり、値はこのグラフ上でのpとqiとの関係から計算されるものである
- これを知識体系Gにおけるpからqiへの値という意味で、 $V_G(qi | p)$ と書くことにする
- qiの相対的な値として $V_G'(qi | p) = \frac{V_G(qi | p)}{\sum_{qj \in Q} V_G(qj | p)}$ と書くこともできるだろう
もし、がqiのもとでの観察pの確率であるとすれば、この話は、確率・尤度、事前確率・事後確率の枠組みでの話となる
- 事前確率・事後確率が出た。これは、ある情報が与えられることによって、尤もらしさが情報が与えられる前の値から情報が与えられた後の値に変わる、という話である
- $V_G(qi | p)$ の例で言えば、新たな情報 rが加わることで $V_G(qi | p,r)$ に変わることだろう
- 今、ある疾患qiに関して真偽をより正確に知りたい(除外診断したい、確定診断したい)としよう
- それはあらたな情報rを得ることによって、 $V_G'(qi | p) = \frac{V_G(qi | p)}{\sum_{qj \in Q} V_G(qj | p)}$ を $V_G'(qi | p,r)$ に変えたときに $\frac{V_G'(qi | p,r)}{V_G'(qi | p)}$ が有用なだけ１から離れる(大きくなれば確定診断に近づき、小さく慣れば除外診断に近づくことになる)
- 逆に言えば、意味のある情報集合Rの要素 $rk \in R$ に関して、 $\frac{V_G'(qi | p,rk)}{V_G'(qi | p)}$ が最もおおきくなるようなrkは、確定診断のために最も有用な情報であるという考え方もできる
- 書き方があると便利なので、 $D_G(rk | (qi | p)) =\frac{V_G'(qi | p,rk)}{V_G'(qi | p)}$ とでも書くことにしよう
- この表記を使えば、 $D_G(rk1 | (qi | p))$ と $D_G(rk2 | (qi | p))$ との値を比べる(比をとるとか)こともできるだろう。この比は $V_G'(qi | p,rk1)$ と $V_G'(qi | p,rk2)$ との比に過ぎなくて、あまり面白い値ではないのであるが、たとえば、qi1を確定診断したいし、qi2を除外診断したいが、一度にできる検査は一つ、というようなときには $D_G(rk1 | (qi1 | p))$ と $D_G(rk2 | (qi2 | p))$ を比較することになり、 $D_G$ を使う意味が出てきそうである