2014-04-01から1ヶ月間の記事一覧

次に何が出る? ディリクレ実践編

本当にできるかやってみよう まずは、kカテゴリ観察されているときに、元集団のカテゴリ数がkである、と限定した場合 この場合は、kカテゴリでのディリクレ分布そのものであり、ディリクレ分布に従うとき、n回のうち回観察されたカテゴリの期待値はであると…

次に何が出る? ディリクレお話編

昨日は、複数のカテゴリからなる「元集団」から有限回サンプリングしたら、k種類のカテゴリが観測された場合の話をした。 そのときに観測されたk種類のカテゴリだけが元集団を構成しているとみなして、元集団のカテゴリ割合をディリクレ分布として推定する場…

ディリクレ分布をいじる

kカテゴリあって、全部でN回サンプリングしたところ、それぞれが回ずつ観測されたとする。ただし このとき、サンプリング元のkカテゴリの割合をは確率変数であって、そのような確率はに従うと想定するとよいことが知られていて、この分布をディリクレ分布と…

Ewen’s sampling formulaとクラスタ数

http://www.stat.uchicago.edu/~pmcc/pubs/clusters.pdf クラスタ数が不明なときに、観測データからクラスタ数をどう読み取るか Ewens's sampling formula(Wiki) 不定のクラスタをもつ集団からの有限サンプリングに関する集団遺伝学・生態学的な式 untbパッ…

離散ラプラス分布

Y染色体は染色体全体のハプロタイプを問題にする、という特別な事情があるために、集団にどんなハプロタイプがどれくらいの割合であるのか、とか、二つのY染色体ハプロタイプがたまたま一致する確率はどれくらいか、と言うことが問題になります。 しかしなが…

証拠を突き合わせること

# 証拠を突き合わせること〜あいいれない証拠〜法数学勉強会20140426のメモ ## はじめに いくつかの証拠を突きあわせて判断する場合に、すべての証拠がある仮説をそろって支持する場合と、そうでない場合とを比較して、どんなときに、どんな確率や尤度が気に…

リプレース

メモリンク n <- 50 n.iter <- 100000 N <- 40 r.with.replace <- r.without.replace <- matrix(0,n.iter,N) for(i in 1:n.iter){ x <- rnorm(n) r.with.replace[i,] <- sample(x,N,replace=TRUE) r.without.replace[i,] <- sample(x,N,replace=FALSE) } m.w…

リサンプリング・リプレース。メモ

Non-negative Matrix Factorization

こちらの論文で腫瘍のシークエンスデータを用いて、変異の入った遺伝子とそうでない遺伝子との情報を行列化し、それにNon-negative Matrix Factorizationを使って腫瘍のクラスタリング、特性(治療反応性とか)予測、特性に影響しているパスウェイ検出などを行…

患者中心の帰結研究:PCORI Methodology Standards

PCOR: Patient-Centered-Outcomes-Researchというのがある。 PCOR-Institute (PCORI)のサイトはこちら そこにある、PCORのための方法論という文書を眺めてみよう 内容立て 1. 答えを得るべき設問(Research questions)の立て方のスタンダード 2. 患者中心とい…

プロスペクト理論の関数をプロット

MIKUでプロスペクト理論を教えてもらった(Wiki記事) 経済的価値は貨幣量に関して、心理上は対数化して感じられるということ 経済状態の「正負(貯蓄・借金)」の影響を考慮すること それを価値関数のパラメタ表現でモデル化すること 儲けに関する確率事象を前…

プロスペクト理論の関数をプロット

順序とかのための正確検定法パッケージ

量的データだけれど、分布を仮定していいのかわからない 同じ値がある(Tie(タイ)がある) グレード別のデータ(タイばっかり) というような場合 しかもサンプル数が、え、これだけ? いくつかの方法を正確検定中心にまとめたらしいパッケージがexactRankTests…

論文メモ

分割表関連の英語表現を参照するための論文(こちら) Data augmentation in multi-way contingency tables with fixed marginal totals

Association Ruleの視覚化パッケージarulesViz

arulesパッケージとarulesVizパッケージとを使ってAssociation Rule法の出力の中身とその視覚化について確認します。 以下はRmdファイルです。こちらなどを参考にすれば、自由にhtml文書化・epub化できます(が、それが面倒な場合には、kindleで→こちら) メモ…

関連ルール法 Association Rule法をいじる

BUGSのときのWishart分布

ここのところBUGSをやっていて、こちらにWishart分布についてメモした その続き BUGSで多変量正規分布の分散共分散行列を推定したいとき、なるべくばらばらな半正定値行列をランダムに発生させたい そのときにWishart分布から半正定値行列を発生させるわけだ…

BUGSのときのWishart分布

Wishart分布

BUGSをやっていると多変量正規分布の発生とかが出てくる そのためにWishart分布とかも出てくる Wishart分布は正方行列の集合に確率が与えられている Wishart分布はカイ二乗分布の多次元版 カイ二乗分布は自由度次元の標準正規分布を距離の二乗にしたもの Wis…

Wishart分布

複眼でデータ空間を眺める?

トンボやハエの眼は複眼 ヒトの目の構造とずいぶん違う 光刺激の受容装置としての大きな違いは次のように言われる 複眼:広い視野・動体感知力の高さ・明暗対応の良さ ヒトタイプの眼:高解像度 そんな複眼だが、その特性を活かしてロボットなどに搭載される…

ぱらぱらめくる『The BUGS Book』

The BUGS Book: A Practical Introduction to Bayesian Analysis (Chapman & Hall/CRC Texts in Statistical Science)作者: David Lunn,Chris Jackson,Nicky Best,Andrew Thomas,David Spiegelhalter出版社/メーカー: Routledge発売日: 2012/11/01メディア: …

ベイズ推定と幻視

James-Stein推定やGaussian sequence modelやBUGSでベイズをやっている 視覚的に情報を処理して、「ああ、ここにはこういう真実像があるということなんだ」と納得する(それを支持する数値を算出する)、というのがパターン認識であるし、スムージングだったり…

次世代シークエンサーと遺伝カウンセリング

次世代シークエンシング・Whole genome sequencing の登場で遺伝カウンセリングの主要標的であった、新生児スクリーニングも変化を余儀なくされている こちらのペイパー(Genomic Counseling in the Newborn Period: Experiences and Views of Genetic Counse…

使ってみよう〜BUGS(乱数を使ってベイズ推定)〜R+openBUGS

ここ数日のR+opeBUGSの使用歴を散逸しないようにepub化 以下はRmdファイルです。こちらなどを参考にすれば、自由にhtml文書化・epub化できます(が、それが面倒な場合には、kindleで) 近くこちらから 使ってみよう?BUGS(乱数を使ってベイズ推定)?R+openBUGS作…

R+openBUGS epub