ベイズ

手法・目的の分類オーバービュー〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…

どんなことが課題か〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Challenge 1 Multiple-Comparison Issue Challenge 2 High-Dimensional Biological Data Challenge 3 Small-n and Large-p Problem Challenge 4 Noisy High-Throughput Bi…

90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

対象(医科学修士院生1回生) 資料 Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Beyond the hype: Big data concepts, methods, and analytics Big Data Analysis Using Modern Statistical and Machine Learning Meth…

ウィーナー過程の事後分布

1次元空間をウィーナー過程で進んでいるとする。任意の2時刻s tをとると、位置座標の差は平均0、分散t-sの正規分布に従うのがウィーナー過程 今、2時刻s,tでXs,Xtに観測されたとすれば、ある時刻u (s正規分布が、Xu-Xsとなる確率である)であって、かつ、(…

数式を知らない生物のパターン認識

生物は、別に直線とはであることを知っていたりするわけではなく、「ありふれたインプット」を蓄積して、新たなインプットをそれと照合していることだろう たとえば二次元視覚入力の場合、2次元平面に光刺激のパターンを受け取り、それが頻回ならば、それを…

Dirichlet diffusion trees

先日の記事の続き 昨日の木はDirichlet diffusion treeの分岐プロセスをグラフオブジェクトに乗せて作る話だった 昨日の記事では、分岐確率を時刻の関数とし、さらに、各エッジで同道している「先行者」の数で重みづけすることを述べたが実装は面倒なので省…

Dirichlet diffusion trees

先日の記事の続き 作り方 原点から第一の要素がランダムウォークする。単位時間後とすれば、ランダムウォークするので、平均0、分散がある値(1としてもよいだろう)の点(t=1,x)に到達する 第二以降の要素は、原点から出発し、「分離」イベントが起きるまでは…

Dirichlet diffusion trees

資料1 資料2 資料3 資料4 データがあって、このモデルに合うか、あのモデルに合うか、この仮説に合うか、あの仮説に合うか、というのを考えるとき「尤度」「尤度比」を使って、事前確率を事後確率に変える このモデル・あのモデルと考えつつ、MCMCで事前…

「先生ならどうしますか?」というベイズ

医療において選択肢があるとき、「インフォームド」して「さあ、選びなさい」という場面を作ることができる 「途方に暮れるヒト」というのは居る 自分自身も決められずに困ることがある そんなときに「先生、決めて下さい」という展開になることもなくはない…

複眼でデータ空間を眺める?

トンボやハエの眼は複眼 ヒトの目の構造とずいぶん違う 光刺激の受容装置としての大きな違いは次のように言われる 複眼:広い視野・動体感知力の高さ・明暗対応の良さ ヒトタイプの眼:高解像度 そんな複眼だが、その特性を活かしてロボットなどに搭載される…

ベイズ推定と幻視

James-Stein推定やGaussian sequence modelやBUGSでベイズをやっている 視覚的に情報を処理して、「ああ、ここにはこういう真実像があるということなんだ」と納得する(それを支持する数値を算出する)、というのがパターン認識であるし、スムージングだったり…

使ってみよう〜BUGS(乱数を使ってベイズ推定)〜R+openBUGS

ここ数日のR+opeBUGSの使用歴を散逸しないようにepub化 以下はRmdファイルです。こちらなどを参考にすれば、自由にhtml文書化・epub化できます(が、それが面倒な場合には、kindleで) 近くこちらから 使ってみよう?BUGS(乱数を使ってベイズ推定)?R+openBUGS作…

カーネル分布推定をBUGSで

昨日は混合比の推定も含めた、混合分布推定をBUGSでやった(こちら) ある一次元データが得られたとき、その個々の観測を中心としたカーネル関数の混合分布として背景の分布を推定することがある カーネル関数として正規分布を取ることも多く、そのときに問題…

混合分布をBUGSで推定する

ここ数日の記事はBUGS 混合分布をやってみる(参考はこちら) Mixture distribution model 今、全部でN人がエントリーしている100m走大会があるとする N runnners registered for a 100m race このうち、pi[1]の割合で招待選手(群 g=1)、pi[2]の割合で一般参加…

winBUGS関数パラメタ一覧編

このマニュアルの57ページからに対応しています ベルヌーイ分布 ## winBUGS r ~ dbern(p)#### R N <- 1000 p <- 0.3 R <- sample(0:1,N,replace=TRUE,prob=c(1-p,p)) hist(R) 二項分布 ## winBUGS r ~ dbin(p,n)#### R n <- 100 R <- rbinom(N,n,p) hist(R) …

winBUGS関数パラメタ説明編

昨日の記事でR+openBUGSのことを書いた winBUGS ~ openBUGSでの分布関数を使ってモデル指定しないといけない 分布関数には形状パラメタとか尺度パラメタとかがあるけれど、場合によって、使い方が違ったりするので、BUGSのモデル設定のパラメタがどういう指…

rstan

Stanについてはこちらに紹介記事があり、環境整備に関しては、こちらを参考にして、以下のようにやればよいようです(Windowsの場合) 基本的には Rがあって Rtoolsを入れて、Rcppパッケージが動くようにして、inlineでのRcppによるRのC++化を可能にし rstanを…

openBUGS

Bayesian inference using Gibbs sampling:BUGS は、ベイズ推定を計算機統計学的にやってしまいましょうという手法(Wiki記事) 計算機統計学的に…という部分は、「難しい関数記述(の省略できるところ)省略して、MCMC/Gibbs samplingで代用する」という風に読…

二次形式なLoss fucntion

こちらでGaussian Sequence Modelをなぞっている 遅々として進まないのだが、まあそれはよいとして、今は、Loss functionとして二次形式なもので正定値な行列を挟んだものを使うと、Bayesian estimatorは観測値に基づく真値の事後分布の期待値になるよ、それ…

かいつまむこと

こちらでたくさんの値を一括して観察したときに、個々の観察について推定する話の1つをやっている(まだ読み終わっていないけれど) 要するに、「たくさんの値を観察」して、それらが「全くの無縁であるわけではない」ときに、「一緒に観察した値を反映」させ…

マルチプルテスティング:James-Stein推定

こちらから my.JS.estimate <- function(x){ m <- mean(x) A1 <- (length(x)-2)/sum((x-m)^2) y <- (1-A1)*(x-m) +m return(y) } n.iter <- 1000 N <- 1000 A <-pi R.As <- R.Bs <- rep(0,n.iter) for(i in 1:n.iter){ # 変なデータとして、正規分布と指数分…

メモ

背景 はっきりとしたことがいえるほどの情報がない状況。そもそも集まらなそうな状況 例を挙げよう 希少な状況・相対的に希少な状況 時間変化がある状況 情報がそのまま当てはまらない状況 情報化:情報は集まる。判断に関してプアな状況 「決断理論」の学際…

単純なルールを予測する

統計学やデータ解析ではモデルを単純にしよう、という大前提を使う。「オッカムの剃刀」。これは、モデルの過適合を避けよう、という意図に通じている 統計学・データ解析によらず、原則、「オッカムの剃刀」で行こうよ、という立場は強く、それが「物理の法…

検査を使って判断する

こちらで臨床検査の感度特異度の話、そのベイズ的使用のためにきおくするべきことの話が出ている 興味深い 現実医療現場では、「状況(事前確率の高低カテゴリ)」「使用検査」「判断したいこと=確定診断したい・ルールアウトしたい」の組み合わせに対して、…

いい感じの事前分布

事前分布(Prior)について、Wikiの記事の引用文献は1968年のそれである(Wikiの記事によれば、2009年のに再掲載されている Maximum entropy Probability Distribution(Wiki)の話である 最大エントロピー原理は、ある情報が与えられた状態で(与えられていなくて…

判断の異同とか

こちらのDNA多型学会のネタの整理をする 思いつくままに雑多に 情報を使って、判断する枠組みは、意識的にせよ無意識的にせよ、事前確率と事後確率とその計算関数(これに個人差があるだろう)とを使っているとする ただし、事前確率+情報→事後確率、のパター…

1人か不定人数か

N人の人のうち、ある1人が「○」で残りのN-1人が「×」の場合 N人の人のうち、k人が「○」で残りのN-k人が「×」の場合、ただしk=0,1,...,N 問題設定を少し変えよう N人のうち、i人が「○」で残りのN-i人が「×」の場合でiは特定の値とし、そのiについての和とし…

ディリクレ過程

IEEE International Conference on Bioinformatics & Biomedicine こちら ノンパラメトリックベイズとそこでのディリクレ過程が気になる ディリクレ過程とノンパラメトリックベイズについてはこちら 混合分布推定 こちらの話題だと、周期性を仮定する時系列…

ベイズによるRJMCMC(reversible jump MCMC)

Statistical genetics Fitting phenotypes. T Casci 9 2008 Predicting Unobserved phenotypes for complex traits from whole-genome SNP data. SH Lee et al. PLosS Genet 4:e1000231 2008 帰無仮説を検定して多重検定に耐えうる統計的有意水準を得るとい…

駆け足で読む Bayesian Computation with R

Bayesian Computation with R (Use R)作者: Jim Albert出版社/メーカー: Springer Verlag発売日: 2007/07/01メディア: ペーパーバック購入: 2人 クリック: 7回この商品を含むブログ (5件) を見る 1. An Introduction to R Rの関数、コマンド #file読み込み d…