決断

分割表〜遺伝情報活用のための遺伝統計学

ケース・コントロールスタディ (患者、非患者) x (要因あり、なし) --- title: "遺伝情報活用のための遺伝統計学" author: "ryamada" date: "2016年10月2日" output: html_document --- # 概論 遺伝的バリアントのリスクに関するデータを読み、それがもた…

遺伝情報活用のための遺伝統計学

目次 ローカスリスク 分割表 オッズ比・回帰係数 点推定・区間推定・ベイズ推定 家系におけるアレル保有率推定 他と比べる推定 マルチプルテスティング補正 棄却 FDR 進め方 典型例の提示 データのシミュレーション作成 検定・推定の実際 検定・推定結果の統…

Actionable〜一つの考え方

こちらにActionableなデータ・データサマリーに関する記事がある 二つの立場からのActionabilityについて書いている データ解析者・データ解析結果を提示する人、という立場からのactionableデータの特徴 Trusted ; Based on credible data, generated in a …

分割表として一般化

昨日の話題は説明変数が2値、従属変数も2値 従属変数を3値に拡張 また、計算を少し速く 図は従属変数が3値。灰色は仮説空間。黒い点は複数の仮説が指し示す「最尤モデル」でその強さを点の大きさにしたもの。赤い点は全体総合の「平均」 # n元テーブル #…

分割表として一般化

昨日の話題の一般化 昨日は2x2表からベータ分布を使って、事後生起確率分布を算出する話と、それを数値計算的に出す話を書いた 数値計算にするにしても、次元が膨大になると大変そう…と思ったり、要因の数が大きくなりすぎると、overfittingがどういう形で効…

仮説亜空間の次元

前の記事の課題を一般性を持たせて書いておこう 今、個の仮説があって、それに対応して、空間に定義された個の確率密度分布がある 事前確率として、が想定されているとき、事前確率密度分布は、ただし、と表される。 ここでデータ・エビデンスがもたらされた…

数値計算的にやろう あっちかこっちか

ベータ分布を用いた理論的計算を前の記事で書いた 既知分布を使えないこともある そんなときに、うまく数値計算的に同じことができると便利 # 数値計算的にやろう # 既存の関数などが使えないが、2次元空間に格子状の確率値が得られたとして、同じことを実…

あっちかこっちか

これは下書き 昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+) a b X(-) c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)…

あっちかこっちか

昨日の話題の脇道 要因Xのありなしとともに、ある事象Yの生起の有無の集計をとったら Y(+) Y(-) X(+)女 a b X(-)男 c d だったという さて。新しいサンプルがX(+)だったときに、Yの生起確率に何を思うのか… X(+),X(-)で生起確率が違うのなら、(a,b)を用いて…

鑑別診断と『確定診断』

鑑別診断は、観察情報による診断名ごとの事後確率を計算すること 事後確率を比較し、十分な尤度的根拠があるとみなせれば一つの診断名に『確定』する 場合によっては複数の診断名に『絞り込む』 診断名が決まると、考慮する必要が思い浮かばない数多の治療法…

治療評価の結果を使って判断に役立てること

同一の条件に対して発生した0/1の集計結果から、1になる確率を推定するときにベータ分布を使うことがある 1個の量的変数に依存して発生する0/1の集計結果から、量的変数に関してロジスティック関数に回帰することもよくある ロジスティック関数への回帰では…

治療評価

(治療)介入がよかったかわるかったかの評価をすることはよくある(いつも評価する) 評価というのは、尺度に照らすこと 最も簡単な尺度は、0か1かに分けること 「効いた」か「効かなかった」か もう少しだけ複雑にすれば「効いた/効かなかった」「副作用があっ…

治療介入

治療介入というのは、病的亜分布を時間経過後にどこかしらに移動させる力のあるもの 病的亜分布は「なにもしな」くても状態空間の中を移動して行くが、介入をするとその移動パターンが変化する 「全体としてよい治療」というのは、その亜分布を「全体」とし…

病的状態と診断と診断基準

非病的状態は空間に分布をなしている 病的状態はそこからの逸脱であって、なにがしかのまとまりをもつ亜分布 非病的状態と病的状態とには道があることもあれば、両者は分布特性上、区切ることのできないひとつながりかもしれない 道は前疾病状態とみなすこと…

状態空間

状態空間が真のものであるにせよ、観察可能項目が張る空間であるにせよ、多次元空間 状態を動的定常状態として、そこから観察される項目の観察項目は状態の「座標」ではない、というように考えてもよいし、観察項目が張る空間において、「定常状態」は「軌道…

ベイジアンネットワーク

上のネットワークには、観察しえない・数値化しえないノードが3つある 真のpre/post状態とその比較評価の3つである 「観察できない」ものを「隠れ」ているとみなすのが「隠れマルコフ」の「隠れ」だが、「ないもの」はそもそもどうカテゴリ化したらよいの…

確率変数たち

「状態を観察して診断して介入計画を立てて介入結果を観察して介入効果を判断する」というごく単純な枠組みを考える これを経時的に行うと真の状態は不明なままに観察のみを用いて操縦することと同じになるのでカルマンフィルタ的なプロセスになる(がここで…

単純な系

量的計測値がある その後、量的計測値が対応してとれる たとえば、治療前の検査値(x)と生存期間(y)、とか 昨日はkNN密度推定を使って、x,yが多次元データであって、しかも、分布が「なんでもあり」なことをやった 今日は思い切り単純にして、xも1次元、yも…

メモ

決断に関するメモ Multi-armed bandit exploration-exploitation dilemma Bandit for clinical trials 機械学習とBandit Exploration-exploitation

学習・情報量・判断・情報担体としての生命体

こちらで『情報理論』をぱらぱらめくっている 次から次に系列化して起きる事象があるときの情報の取扱いについて「情報源」という術語を用いて説明している そこから考えられる周辺のこと。いずれも情報量的に解釈することが大事そう。 情報源には「テキスト…

決断ヒストリーのシミュレーション

約1か月前、決断の話を始めた(こちら) ●は赤を出して勝ち、○は赤を出して負け、■は青を出して勝ち、□は青を出して負けとした ●●○○■○■■■□●●□●○○■■□□□● こんな●■○□の並びが、「決断過程」として妥当な感じがするかどうか、とか、妥当って何か、とかそんなとこ…

メモ

ps <- c(0.2,0.8) N <- 30 library(combinat) calc.survival.2 <- function(X){ ret <- 0 for(i in 1:length(X)){ tmp <- expand.grid(0:(length(X[[i]][,1])-1),0:(length(X[[i]][1,])-1)) tmp.2 <- apply(tmp,1,sum) ret <- ret + sum(tmp.2 * X[[i]]) } r…

判断支援

決断とか選択とか判断とか、そんなことをやっていて、ごちゃごちゃ書いているわけだけれど(こちらが現時点で一番かっちりまとめたメモ。一番やりたいのは「診断支援」なわけではあるのだが)、結局、「情報提供して、当の本人に選んでもらう」っていうのがよ…

判断支援

ひとしきり「決断」ということを考えている ただ一つの正解があるわけではないときに選択肢からどれを選ぶか、を決断と呼んでいる こちらでは医学知識の体系化・その臨床診断支援への可能性とか(遠大すぎて、本気とは思えない段階だけれど)のための基礎的な…

空間:選択肢、帰結、選択ルール

帰結の空間: 選択肢の空間: 生起確率密度分布の空間: は;を満足する関数すべて ある選択肢のもとでの生起確率密度分布が成立する確率密度分布: 選択肢を条件とする帰結の観察空間: ある観察のもとでの選択肢に想定される確率密度分布関数の確率密度分布…

下限のある分布の比較

下限のある分布の推定で、正規分布を折り返し(非心カイ分布)にするか、非心カイ分布にしたうえでここの構成小分布の期待値を気にするかについて、いろいろやったが、そもそも、非心カイ分布では期待値を十分に小さくできないこともあることがわかり、推定結…

どのカイ分布・カイ二乗分布を選ぶか

Rのdensity()関数の中身をedit(density.default)として表示させると、ガウシアンでのカーネル密度推定では、bwというパラメタを「バンド幅」としていることがわかる さらにこのbwは個々の観測値についてそれを平均とする正規分布を作って、全観測値について…

下限のある分布の比較

決断 選択肢があるときに、それぞれの選択肢を選んだ際にどんな帰結があったかのデータを読み、それぞれの選択肢の背後にある分布を予想し、その予想分布を比較することで、選択肢を選ぶ、ということをやっている カテゴリカルな場合については決断ルールが…

折り返し

メモ(SAS) メモ1.5(STATA) メモ2 x <- seq(from=-10,to=10,by=0.01) m <-1.3 y <- dnorm(x,m) posi <- which(x>=0) neg <- which(x<=0) yposi <- y[posi] yneg <- y[neg[length(neg):1]] y1 <- yposi+yneg plot(y1,type="l")

量的データで決断

帰結が2種類あるときのオプション選択のことを考えた(こちらとか) 帰結が3以上種類あるときのオプション選択のことを考えた(こちらとか) 自然な流れとして、量的帰結についてのオプション選択を考えたい 帰結の分布を観測データからオプション別に思い描い…