ロジスティック回帰
2群の値分布が正規分布に従い、その正規分布の分散が等しい場合。2群は黒群が少なめ 左上の図は、2群の確率密度分布。カーブ下面積は、群の比率になる 中上の図は、値ごとに2群の比率考慮の確率密度から、赤・黒それぞれの相対確率(相対尤度)を計算して…
昨日の話題は説明変数が2値、従属変数も2値 従属変数を3値に拡張 また、計算を少し速く 図は従属変数が3値。灰色は仮説空間。黒い点は複数の仮説が指し示す「最尤モデル」でその強さを点の大きさにしたもの。赤い点は全体総合の「平均」 # n元テーブル #…
昨日の話題の一般化 昨日は2x2表からベータ分布を使って、事後生起確率分布を算出する話と、それを数値計算的に出す話を書いた 数値計算にするにしても、次元が膨大になると大変そう…と思ったり、要因の数が大きくなりすぎると、overfittingがどういう形で効…
前の記事の課題を一般性を持たせて書いておこう 今、個の仮説があって、それに対応して、空間に定義された個の確率密度分布がある 事前確率として、が想定されているとき、事前確率密度分布は、ただし、と表される。 ここでデータ・エビデンスがもたらされた…
ベータ分布を用いた理論的計算を前の記事で書いた 既知分布を使えないこともある そんなときに、うまく数値計算的に同じことができると便利 # 数値計算的にやろう # 既存の関数などが使えないが、2次元空間に格子状の確率値が得られたとして、同じことを実…
これは下書き 昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+) a b X(-) c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)…
昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+)女 a b X(-)男 c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)を用いて…
鑑別診断は、観察情報による診断名ごとの事後確率を計算すること 事後確率を比較し、十分な尤度的根拠があるとみなせれば一つの診断名に『確定』する 場合によっては複数の診断名に『絞り込む』 診断名が決まると、考慮する必要が思い浮かばない数多の治療法…
同一の条件に対して発生した0/1の集計結果から、1になる確率を推定するときにベータ分布を使うことがある 1個の量的変数に依存して発生する0/1の集計結果から、量的変数に関してロジスティック関数に回帰することもよくある ロジスティック関数への回帰では…
(治療)介入がよかったかわるかったかの評価をすることはよくある(いつも評価する) 評価というのは、尺度に照らすこと 最も簡単な尺度は、0か1かに分けること 「効いた」か「効かなかった」か もう少しだけ複雑にすれば「効いた/効かなかった」「副作用があっ…
治療介入というのは、病的亜分布を時間経過後にどこかしらに移動させる力のあるもの 病的亜分布は「なにもしな」くても状態空間の中を移動して行くが、介入をするとその移動パターンが変化する 「全体としてよい治療」というのは、その亜分布を「全体」とし…
非病的状態は空間に分布をなしている 病的状態はそこからの逸脱であって、なにがしかのまとまりをもつ亜分布 非病的状態と病的状態とには道があることもあれば、両者は分布特性上、区切ることのできないひとつながりかもしれない 道は前疾病状態とみなすこと…
状態空間が真のものであるにせよ、観察可能項目が張る空間であるにせよ、多次元空間 状態を動的定常状態として、そこから観察される項目の観察項目は状態の「座標」ではない、というように考えてもよいし、観察項目が張る空間において、「定常状態」は「軌道…
上のネットワークには、観察しえない・数値化しえないノードが3つある 真のpre/post状態とその比較評価の3つである 「観察できない」ものを「隠れ」ているとみなすのが「隠れマルコフ」の「隠れ」だが、「ないもの」はそもそもどうカテゴリ化したらよいの…
「状態を観察して診断して介入計画を立てて介入結果を観察して介入効果を判断する」というごく単純な枠組みを考える これを経時的に行うと真の状態は不明なままに観察のみを用いて操縦することと同じになるのでカルマンフィルタ的なプロセスになる(がここで…
アディティブモデル用のトレンドカイ二乗統計量とロジスティック回帰との関係を見たい それが見えやすいように、分割表を表す文字・添え字を以下のように工夫する 分割表 ロジスティック回帰では、アレル本数に関しての確率で表現型が1,0にわかれるとし、を…
Joint Statistical Meeting 2010 @ Vancouverの講義(2010/08/02)(主なセッションはこちら) Analysis of Ordinal Categorical Data 種本 Analysis of Ordinal Categorical Data (Wiley Series in Probability and Statistics)作者: Alan Agresti出版社/メーカ…
背景はこちらの記事とこちらの記事で。 注!もろもろ、未検証のβ版です。 おそらく大丈夫 まとめなおした記載はこちら 添付は、このベータ版関数の出力について次の3相関をプロットしたもの。上段が、6カウントについて、ロジスティックのpとトレンド検定…
今、次のような2x3カウントデータのファイルがあるとする。 rs1 10 20 30 40 20 10 rs2 11 21 31 41 21 11 ファイルを読み込んでロジスティック回帰をして、そのを返す関数 LogisticTestColumns2<-function(file,columns){ data<-read.table(file) res<-c…