ベイジアンネットワーク
Rのbnlearnパッケージを使う ジェノタイプ推定で学ぶベイジアンネットワーク 法廷のためのベイジアンネットワーク その解説文書
http://d.hatena.ne.jp/ryamada22/20141115:この日の記事でジェノタイプ推定のためのベイジアンネットワークについて書いた そこで、ジョイント確率を計算するときには、併せて計算したノードを「propagate=TRUE」で指定すると計算が速くなることを利用した…
PDF 昨日の記事はベイジアンネットワーク ベイジアンネットワークはグラフィカルモデルの一つ 条件付き確率を扱う Directed acyclic graph もう一つのグラフィカルモデルにマルコフランダムフィールドがある 要素間の相互関係を扱う Undirected graphでサイ…
ベイジアンネットワークは確率事象の関係をグラフにして、情報が与えられたときの事後確率を計算してくれる 家系図があるとき、一部個人のジェノタイプがわかっているとき、ほかの個人のジェノタイプを推定する作業をベイジアンネットワーク化することができ…
昨日の記事で、BRACAPROとかその姉妹版がどんなものかを理解するためのイントロを書いた 今日の記事はその清書 Rmarkdownでepub可能な形にしました この本の姉妹編(分離比解析)はこちら 詳しくは以下の通り Rmdファイルです。html化、epub化できます(やり方…
昨日の記事で、BRACAPROとかその姉妹版の話を書いた その背景には家系データを扱うという、「マイ・ブーム」がある(こちら) 以前、法医学関係でベイジアンネットワークについて書いたので、復習を兼ねて、少数ローカスがリスクを運び、それによって発病年齢…
何がこの本の動機か、と言えば、以下の質問に答えること 原因の集合と科学的証拠の集合との関係はいかなるものか。ただし、通常、原因は観察することができず、科学的証拠は観察できるものである。 1つまたは複数の判断すべき命題があったときに、それに関…
Bayesian Networks and Probabilistic Inference in Forensic Science (Statistics in Practice)作者: Franco Taroni,Colin Aitken,Paolo Garbolino,Alex Biedermann出版社/メーカー: Wiley発売日: 2006/04/07メディア: ハードカバーこの商品を含むブログを…
昨日の話題は説明変数が2値、従属変数も2値 従属変数を3値に拡張 また、計算を少し速く 図は従属変数が3値。灰色は仮説空間。黒い点は複数の仮説が指し示す「最尤モデル」でその強さを点の大きさにしたもの。赤い点は全体総合の「平均」 # n元テーブル #…
昨日の話題の一般化 昨日は2x2表からベータ分布を使って、事後生起確率分布を算出する話と、それを数値計算的に出す話を書いた 数値計算にするにしても、次元が膨大になると大変そう…と思ったり、要因の数が大きくなりすぎると、overfittingがどういう形で効…
前の記事の課題を一般性を持たせて書いておこう 今、個の仮説があって、それに対応して、空間に定義された個の確率密度分布がある 事前確率として、が想定されているとき、事前確率密度分布は、ただし、と表される。 ここでデータ・エビデンスがもたらされた…
ベータ分布を用いた理論的計算を前の記事で書いた 既知分布を使えないこともある そんなときに、うまく数値計算的に同じことができると便利 # 数値計算的にやろう # 既存の関数などが使えないが、2次元空間に格子状の確率値が得られたとして、同じことを実…
これは下書き 昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+) a b X(-) c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)…
昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+)女 a b X(-)男 c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)を用いて…
鑑別診断は、観察情報による診断名ごとの事後確率を計算すること 事後確率を比較し、十分な尤度的根拠があるとみなせれば一つの診断名に『確定』する 場合によっては複数の診断名に『絞り込む』 診断名が決まると、考慮する必要が思い浮かばない数多の治療法…
同一の条件に対して発生した0/1の集計結果から、1になる確率を推定するときにベータ分布を使うことがある 1個の量的変数に依存して発生する0/1の集計結果から、量的変数に関してロジスティック関数に回帰することもよくある ロジスティック関数への回帰では…
(治療)介入がよかったかわるかったかの評価をすることはよくある(いつも評価する) 評価というのは、尺度に照らすこと 最も簡単な尺度は、0か1かに分けること 「効いた」か「効かなかった」か もう少しだけ複雑にすれば「効いた/効かなかった」「副作用があっ…
治療介入というのは、病的亜分布を時間経過後にどこかしらに移動させる力のあるもの 病的亜分布は「なにもしな」くても状態空間の中を移動して行くが、介入をするとその移動パターンが変化する 「全体としてよい治療」というのは、その亜分布を「全体」とし…
非病的状態は空間に分布をなしている 病的状態はそこからの逸脱であって、なにがしかのまとまりをもつ亜分布 非病的状態と病的状態とには道があることもあれば、両者は分布特性上、区切ることのできないひとつながりかもしれない 道は前疾病状態とみなすこと…
状態空間が真のものであるにせよ、観察可能項目が張る空間であるにせよ、多次元空間 状態を動的定常状態として、そこから観察される項目の観察項目は状態の「座標」ではない、というように考えてもよいし、観察項目が張る空間において、「定常状態」は「軌道…
上のネットワークには、観察しえない・数値化しえないノードが3つある 真のpre/post状態とその比較評価の3つである 「観察できない」ものを「隠れ」ているとみなすのが「隠れマルコフ」の「隠れ」だが、「ないもの」はそもそもどうカテゴリ化したらよいの…
「状態を観察して診断して介入計画を立てて介入結果を観察して介入効果を判断する」というごく単純な枠組みを考える これを経時的に行うと真の状態は不明なままに観察のみを用いて操縦することと同じになるのでカルマンフィルタ的なプロセスになる(がここで…
先日、法廷でベイジアンネットワークという記事を書いた 病院だとどうなるか? ごく簡単に ネットワークを作るとき、病気である事前確率は有病率などで決まる。問診の結果で有病率推定事前確率を決めてもよい 検査をする PPV、NPVで出す これは・・・ librar…
library(gRain) my.forensic.bn.2 <- function(n.p.type,N.p,n.g.type,Freq.g,frac.s,typing.prec.mat,L.prob,mot.levels,M.prob,Cr.prob,rs){ # タイプ別個人の存在 ps <- Gs <- list() yn <- c("1","0") p.type <- paste("p",1:n.p.type,sep="") for(i in …
現場に居たか居ないか、犯行に関与したかしないかで遺留品を残す確率は変わる たとえば、、「柱の噛み跡犯人探し」のときの「噛み跡から検出された唾液」という場合と、「犯行現場付近の自動販売機から検出された指紋」という場合とでは、前者が「現場に居て…
犯行は現場に居ないと犯せない 現場に居て、動機があっても犯すとは限らない 現場に居ると、動機があってもなくても、何かの拍子に犯すかも 確率的に考えても、「最後の犯行実行者は1人(とわかっているときは)」なら、「可能性のある複数人から選ぶ」必要が…
犯行の動機には色々ありえる 旧知の関係なら、仲良しかもしれないけれど、憎悪のきっかけも多いと思われる ベイジアンネットワークでは、カテゴリ変数の扱いが楽なので、「強い動機」「弱い動機」「偶発(動機なし)だけれど犯行につながった」のようなカテゴ…
ある容疑者Xを疑っている。そのほかにたくさん(N=99)の人が「もしかしたら」犯人かもしれない まずは、現場にいたかどうかの確率を計算したい その上で、容疑者Xか、その他大勢か、どちらが現場にいたっぽかったかを数値で比較したい 『犯行現場』を定義しよ…
サンプルの取り違え、タイピングエラーを考慮して、標本のジェノタイプ実験結果から、個人の真のジェノタイプの事後確率を算出する 2人p1,p2居る。2つのジェノタイプがある。 2人からDNAタイピング用のサンプルを採取する。丁寧に取り扱っているので、取…
昨日の記事でRのgRainパッケージのビニェットを動かしてみた 法廷証拠用に使う(〜(ほぼ同じ)臨床判断用に使う)ことを前提に試してみる 標本取り違え・タイピングエラー 現場に居る確率 動機の定量 犯行に及ぶ 犯行現場の遺留品 関数にしてみる