ベイズ

ノンパラメトリック・ベイズ実践編2 回帰

まず、単純に線形回帰 s <- rnorm(n,0,1) head(s) m <- matrix(s,ncol=2) head(m) lm_res <- lm(m[,2] ~ m[,1]) lm_res plot(m) abline(lm_res) pythonで行こう Scikit learn の gaussian process regression そのExamplesの一つ カーネル関数から、値のsimi…

ノンパラメトリック・ベイズ実践編

Non-parametric bayesian clustering Data set simulation n <- 1000 d <- 4 k <- 5 s <- sample(1:k,n,replace=TRUE) m <- matrix(rnorm(d*k,sd=6),k,d) X <- matrix(0,n,d) for(i in 1:k){ tmp <- which(s == i) r <- matrix(rnorm(d * length(tmp))) X[tm…

ノンパラ・ベイズ 夏休み集中セミナーメモ

9月1日 パラとノンパラの基礎概念 資料1『Parametric vs Nonparametric Models』 パラは有限個パラメタ、ノンパラは無限個パラメタのモデル 無限個パラメタのモデルとはどういうことかをわかることが大事 ノンパラベイズは無限個パラメタを想定しつつ、実…

ノンパラ・ベイズ 夏休み集中セミナーメモ0

予定 9月1日(パラとノンパラの基礎概念。ノンパラ検定) 9月17日(ノンパラ・ベイズの短いチュートリアル) 9月22日(長文資料のつまみ食い。R・パイソンで遊ぶ、その1) 9月24日(長文資料のつまみ食い。R・パイソンで遊ぶ、その2) 参加者 A(統計遺…

6 General Posterior Distribution 一般化した場合 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Algebraic geometric transformにより、standard form(5章の形)に持ち込めることを示す となれば、5章で示したStandard formの色々な良い性質がそのまま使える(らしい)

5 Standard Posterior Distribution 事後分布が正規分布の場合 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

モデルが真の分布を含み、推定にあたり、漸近的に正規分布を想定できる場合は簡単。ベイズ推定と最尤推定とがほぼ一致するから 真の分布は正規分布とはみなせないことも多く、その場合は、ベイズ推定のあてはまりがよくなる と一般化できる(そうだ) この章で…

3 Basic Formula of Bayesian Observables 観測量のベイズにおける基礎的な式 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

(1) 真の分布と統計モデルの関係の定義をする (2) 観測変数のベイズ流定義とのそのnormalized version (3) ベイズ予測のキュムラント母関数の定義 (4) ベイズ統計の基礎的な理論事項をキュムラント母関数を用いて証明する(それにより、真の分布とモデルと予…

1 ベイズ統計の基礎 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

真の分布の事前分布があって、それぞれがある観測をもたらす確率がわかっていれば、観測から真の分布の事後分布が計算できる、というのがベイズの定理 残念ながら、事前分布も正確には解らないし、観測をもたらす確率も解っていない(のでモデルを入れる)から…

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

Priorを調整しながらベイズ

あるpriorでMCMCベイズを回して事後分布を得るとする そのpriorは、ある基準で選ばれたpriorだが、別の基準だと「変数変換」しないといけないとする そんなpriorの重み変換をすることができるのか、できるならどうやるのかの調べもの こちらは、この用に適し…

この処理を眺めてみる ベルヌーイ事象とその独立試行の繰り返しの話 二値型確率事象Bookをデータ型として作り、それに生起確率ベクトルを付け加えている。付け加えるときは、weightedという関数を使っている。有限事象の確率変数なのでFiniteというクラスを…

『法数学入門』を書く

まずは章立てを検討する --- title: "法数学入門" author: "ryamada" date: "2017年6月4日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} library(knitr) opts_chunk$set(echo = TRUE) library(rgl…

ぱらぱらめくる『Stan Modeling Language

User’s Guide and Reference Manual』 Stan_Modeling_Language_User's_Guide_and_Reference_Manual Part I イントロ 1. 概要 PartII Stan 言語 Stanを実行するためにhoge.stanをどうやって書くかに関するパート 2. データタイプと変数 パラメタを推定するた…

RとSTANとでBayesianの基礎

ベイズ推定をする データがある モデルがある モデルは、パラメタを持っていて、そのパラメタの値を定めると、データを観察する確率が定義できる Stanでは、このパラメタがどういう分布を取っているかを乱数を使って標本分布として返す パラメタ以外にも、ど…

5.6 複数要因・組み合わせ、独立だったり順序があったり ぱらぱらめくる『はじめての統計データ分析』

stanファイル似て指定する モデルを書き換えて、知りたいことを生成量にすれば、なんでもできる 要因が増えるなら、モデル式の項数を増やす 複数カテゴリに順序を入れてそれらが守られているかどうかは、事後分布から発生した標本のうちそれが満足されるもの…

3.4. 2群のデータ ぱらぱらめくる『はじめての統計データ分析』

t検定が、等分散性の仮定の有無を区別するように、また、対応のありなしを区別するように、事後分布推定もそれぞれの仮定の下で行う 仮定はmodelとして指定する 等分散性の有無は、2群の分散を1つのパラメタで表すか否かで書き分ける 対応があることは、分…

2.MCMCと正規分布の推測 ぱらぱらめくる『はじめての統計データ分析』

2つの内容 MCMCによる事後分布の評価方法と解釈方法 正規分布の推測 MCMC法 推定の対象は分布を取る。データを生成する尤度に基づく事後分布である 計算によって事後分布の最尤値をもとめたり、分布の形を求めたり、区間を求めたりするのは、大変だったり不…

2−5.rstanを自由に動かす ぱらぱらめくる『はじめての統計データ分析』

教科書のコードをコピーペーストすれば、MCMCによる事後分布推定はできるけれど、条件を変えにくい 少し勉強して自由に動かしてみる rstanパッケージのstan()関数に必要なものを渡せばよい どうしても渡さないといけない引数はfile、dataの二つ fileはどうい…

2−4.rstanを動かす ぱらぱらめくる『はじめての統計データ分析』

2章のコードを動かしてみる G1mean()関数は、この教科書が提供しているstanを使う関数。以下のような設定で回るように作られている 正規分布を仮定し 正規分布のパラメタmu,sigmaをサンプリングしつつ そのほかにxaste,log_likともサンプリングする xasteは…

2−3.真偽判定 ぱらぱらめくる『はじめての統計データ分析』

事後分布を推定し、その下で(その各事後分布由来の標本の下で)、Aかnon-Aかの確率を算出すれば、事後分布全体でAかnon-Aかの確率が推定できる これを仮説検定のような意味合いで使うことも可能 ただし、帰無仮説検定では、パラメタ値が0かそれ以外かを…

2−2.データから知りたいことを言葉にする ぱらぱらめくる『はじめての統計データ分析』

2章では、データに基づいて、モデルのパラメタの事後分布を推定することを学んだけれど、それ以外にも、いろいろな「知りたいこと」の事後情報が得られる RQ(リサーチクエスチョン)と称して、複数の「知りたいこと」が列挙してあるので、その意味を確認し、…

MCMC法とサンプリングアルゴリズム ぱらぱらめくる『はじめての統計データ分析』

視覚的に理解する 酔歩しながら、うまくサンプリングする方法(ヘイスティング・ギブスサンプラー) ちょっと工夫して、広く、高採択率でサンプリングする方法(ハミルトニアン) 事後分布を推定したい データを持っている データをもたらしたはずの分布モデルも…

ぱらぱらめくる『はじめての統計データ分析』

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2016/06/02メディア: 単行本(ソフトカバー)この商品を含むブログ (11件) を見る 構成 準備 教科書のRコードが動くことの確認 まえがきと目…

1−2.ベイズと分布〜Rを使う ぱらぱらめくる『はじめての統計データ分析』

真の分布は理論分布ではない(かもしれない) 真の分布として、平均100、標準偏差10の正規分布と平均120、標準偏差30の正規分布の0.7:0.3混合分布を仮定する そのような真の分布からの500人分の観察データをシミュレート作成する n <- 500 pr <- c(0.7,0.3) Ao…

教科書のRコードが動くことの確認 ぱらぱらめくる『はじめての統計データ分析』

自身のコンピュータでRを使っている「場所」を確認する getwd() 例えば > getwd() [1] "C:/Users/ryamada/Documents" となる。"C:/Users/ryamada/Documents"でRを動かしている ダウンロードしたzipファイルを展開した結果、"C:/Users/ryamada/Desktop/stat"…

1.ベイズと分布 ぱらぱらめくる『はじめての統計データ分析』

ポイント ベイズ流では、分布を扱うこと、ベイズの定理を使うこと、事前分布が必要なこと 分布は大事であって、この本では分布を使う、ということ 分布には データ分布・標本分布がある 理論分布がある 分布を使うために知っておくべきこと データ分布と理論…

まえがきと目次を読む ぱらぱらめくる『はじめての統計データ分析』

まえがき この本では 「仮説」と「データ」を持っているときに 「仮説が正しい確率」を計算する 「仮説が正しい確率」を含め、「データ」に基づいて算出する量を「生成量」と呼ぶ 「仮説」を検定しない 目次 1. データの整理とベイズの定理 2. MCMCと正…

準備 ぱらぱらめくる『はじめての統計データ分析』

こちらを参考に、Rコードが動くようにしよう この準備でやっていること Rというソフトウェアをインストールする 『はじめての…』では、rstanという名前のパッケージを使うので、それをインストールしている rstanは統計手法的な「答え」を数学の問題を解くよ…

手法・目的の分類オーバービュー〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…