2016-09-01から1ヶ月間の記事一覧
n人の投擲選手が居て、その人たちの投擲記録について賭けをすることを考える n人の投擲選手の記録はガンマ分布に従うと予想する。ガンマ分布を選ぶのは、0以上の1ピークの分布であって、まあまあいい感じのモデルだから ある選手の記録は以下のような確率分…
ごちゃごちゃしてきて収集がつかない これをうまく整理するには、やはり数式が必要だし、納得するには式変形を見てみる必要がある 数式とその変形を追いかけると、個々の性質の「意味」がどんどんかすんでいくので、そのあたりの折り合いをどうつけるかが課…
指数型分布族の性質や諸要素について、色々な呼称・断片的な知識に曝露されつつも、それらの有機的な関係が乏しい段階 指数型分布族の定義 定義は1つだが、式の書き方はそうではない すべての項を指数の肩に乗せる書き方と、パラメタ単独項を前に出す書き方…
指数型分布族という名前に出会う 以下のようなことを理解する 非常に多くの有名な確率分布がすべて指数型分布族に属する たまに指数型分布族に属さない分布もある。二つの正規分布の混合や、コーシー分布とか。混合正規分布は普通の統計解析アプローチで面倒…
まだ指数型分布族という名前を知らない 指数分布という名前は知っているかもしれない 確率分布・尤度に関しては、以下のようなことを知っている 確率分布はパラメタを使った関数。積分すると1 関数が分布の「様子」を決め、パラメタがその縮尺などを決める …
指数型分布族のことを整理するためにはいろいろな段階があると思う 現時点では、(全部で何段階かあるのかわからないけれど、そのうちの)第3段階あたりに居るような気がする この先、階段を上るためにも、自分の各段階での理解を書いておく 第3段階だけを書…
1次元正規分布を「原点からの距離」で考え直すと、-xとxとが同じ距離にあることになり、に関する分布を考えることとなり、カイ分布になる。距離の二乗で考えることにすればカイ二乗分布 d次元正規分布を「原点からの距離」で考え直すと、原点から等距離にあ…
多次元データが取れる場合と、多次元だけれど、その一部次元のデータしか取れない場合っていうのは、どういう違いがあるのか… multinormal2.stan data { int N_subjects; int N_items; matrix[N_subjects,N_items] y; } parameters { vector[N_items] mu; co…
Stanを使えば事後分布が乱択的に得られる けれど、単純なモデルではつまらないし、普通に回帰等をする方がよっぽどよい どれくらいモデルが複雑だとStanがよいかを言い切るほどよくわかっていないけれど、階層ベイズはそうなのだろう(こちら) SNPの遺伝因子…
ようやくrstanがわかってきたのでまとめ直す まとめ データがある 確率モデルを定め、対数尤度計算をコード化する rのc++連携の仕組みを使ったrstanパッケージのstan()関数を使ってStan推定をする 何がよいのか 上記のまとめは読んでもつまらないまとめにな…
ベイズ推定をする データがある モデルがある モデルは、パラメタを持っていて、そのパラメタの値を定めると、データを観察する確率が定義できる Stanでは、このパラメタがどういう分布を取っているかを乱数を使って標本分布として返す パラメタ以外にも、ど…
modelの部分が何をやっているのか…対数尤度を計算している。その書き方の基礎の基礎→こちら stanの基本的なことだけれど、なかなか探すのが難しいことをかいつまんで書いてあるサイト→こちら 一般化線形回帰を使ってrstanの動かし方を確認する→こちら stanフ…
資料 s成功回数、f失敗回数 試行回数が大きくなるとインデックスはs/(s+f)に収束する 期待値はベータ分布事後分布を用いる インデックスの収束値からのずれは、その時点での予想報酬量のばらつきが多いほど、大きくなる インデックスの収束値からのずれは、…