ディリクレ分布
サンプリングして有限個数の多項分布を生み出すことに関するものと、長さ1を分割する・無限分割することに関するものに大きく2分され、その2つが相互に関連する、という構図になっている 中華料理店過程とその一般化としてのピットマン・ヨー過程 多項標…
一昨日・昨日と、カテゴリ数が未知のときのディリクレ分布の合算の話をしてきた( まだ、この方法でOK、という確信はないのだが、まあ、これまでのところ、出てくる値もそれなりに妥当そうなので、このまま行ってみる(一番、危なそうなのは、事前確率をすべ…
本当にできるかやってみよう まずは、kカテゴリ観察されているときに、元集団のカテゴリ数がkである、と限定した場合 この場合は、kカテゴリでのディリクレ分布そのものであり、ディリクレ分布に従うとき、n回のうち回観察されたカテゴリの期待値はであると…
昨日は、複数のカテゴリからなる「元集団」から有限回サンプリングしたら、k種類のカテゴリが観測された場合の話をした。 そのときに観測されたk種類のカテゴリだけが元集団を構成しているとみなして、元集団のカテゴリ割合をディリクレ分布として推定する場…
kカテゴリあって、全部でN回サンプリングしたところ、それぞれが回ずつ観測されたとする。ただし このとき、サンプリング元のkカテゴリの割合をは確率変数であって、そのような確率はに従うと想定するとよいことが知られていて、この分布をディリクレ分布と…
今、目の前にn.option本の道がある その道には、それぞれ案内板が立っていて、「この道を進むと、n.type種類の猛獣が必ず1頭出ます。これまでの記録では、虎がa頭、蛇がb頭、蜘蛛がc頭…出ました」という情報が得られる 一方、分岐点に立っている「私」は、…
空間があって、そこの座標をとする 多項事象があって、この空間に事象が観察されるとにが得られる ここで、個々の観察対して、それをを中心とした正規分布で空間に起きたとみなせば、その総和は積分が検体数の分布を作る この分布に照らすと、空間の任意の点…
昨日と同じ設定。今日は、各観測点に同じ寄与力を授けたうえで、その寄与力を最大にする1パラメタの最適値推定をする方法でやってみる # 説明変数次元 n.x <- 2 # 被説明変数に影響を及ぼす変数数 n.x.a <- 2 # 被説明変数レベル数 n.y <- 2 Y.level <- 1:n…
複数の因子が多項(二項を含む)の生起確率に影響を与えるらしい サンプルについて因子を観察して生起を観察し、それに基づいて、新規サンプルについて因子を測定して、生起を予測したいというような場合 パラメトリックにやるのもありだけれど、高次元化した…
乱数を使う my.qdirichlet <- function(v,a,n=10000){ r <- rdirichlet(n,a) d <- ddirichlet(r,a) d0 <- ddirichlet(v,a) length(which(d<=d0))/n } ベータ分布で試してみる n <- 100 a <- c(1,1) a2 <- c(3,8) R <- rdirichlet(n,a) q <- rep(0,n) for(i i…
昨日の続き n>=3カテゴリになると、その生起確率ベクトル間の順序付けが面倒臭くなってくる たとえば、帰結がa,b,cの3種類であると、その生起確率ベクトルは長さが3で、(和が1なので)2次元平面上の正三角形空間を占める ここにどんな順序を入れるか、と…
上の例では、複数の選択肢から発生するすべての帰結に順序を入れた。さらに、その順序に応じて、なるべく、「順序が前」の帰結が得られるように「単純な」処理を繰り返した 「順序〜大小関係」のみを用いるというのは、結局のところ、不等号には重み1の差を…
奇病が発生した。この奇病にかかると、音楽と美術とスポーツに関する能力が破壊されるという。音楽は演奏できなくなるし鑑賞もできなくなる。美術は創作活動ができなくなるし鑑賞もできなくなる。スポーツは自らプレイすることができなくなるし、鑑賞もでき…
もう少し考えよう 2つの選択肢があって、それぞれに3つの帰結がある。その3つの帰結のうち2つは共通であるとすれば、帰結は全部で4つある この帰結4つを正四面体の4点に置く こうすれば、ある選択肢の結果はこの正四面体のある面上の分布になる 2つ…
簡単のためにと限定して考えてみる の場合は、どんなことをしているのかがわかっているつもりに慣れるので、それに限局して考えてみる それぞれの正単体ははいずれも1次元空間の長さ1の線分である この2つの正単体の直積空間は単位正方形である 2つの選…
ベータ分布 特にが整数であれば、 > x_1 <- 4 > x_2 <- 3 > beta(x_1,x_2) [1] 0.01666667 > 1/choose(x_1-1+x_2-1,x_1-1) * 1/(x_1+x_2-1) [1] 0.01666667 > beta(x_1+1,x_2+1) [1] 0.003571429 > 1/choose(x_1+x_2,x_1) * 1/(x_1+x_2+1) [1] 0.003571429 …
昨日の記事で2つの選択肢の間の決断のことを書いた そこでは、選択肢それぞれの帰結には「成功と失敗」の2つがあり、過去の記録に基づいて、その選択肢の成功の多寡に関する推測をして、より成功しやすそうな選択肢を確率的に選ぶことを書いた 過去の記録…
総数を固定しなくても… メモ は (スターリングの公式)より であって に注意したり、,に注意したりして変形すると この式の移行関係には、対数尤度比がカイ自乗分布に従うという話がある k <- 5 library(MCMCpack) f <- c(rdirichlet(1,runif(k))) N <- 10000…
2項分布の連続化:β分布 多項分布の連続化:ディリクレ分布 確率ベクトル、観測度数, 確率 に制約をつけつつ、確率を最大にするようなが知りたいとする Rのoptim()関数で最適化することにする 少し普通ではない変数の置き方をする 長さのベクトルを考える …
IEEE International Conference on Bioinformatics & Biomedicine こちら ノンパラメトリックベイズとそこでのディリクレ過程が気になる ディリクレ過程とノンパラメトリックベイズについてはこちら 混合分布推定 こちらの話題だと、周期性を仮定する時系列…
Mathematicaのディリクレ乱数サンプリングも普通にガンマ関数 DirichletパーフェクトサンプリングPDF 京大数理解析研のサイトにアブストラクト coupling from the past(CFTP) アルゴリズムのjava applet