2016-08-01から1ヶ月間の記事一覧

ベルマン方程式

調べものをしましたが、日本語サイトの中でこちらが一番、わかりやすく参考にさせていただきました ベルマン方程式というものがある。Wikipediaではベルマン方程式(リチャード・E・ベルマン)、もしくはBellman_equation 選択肢があるときに、どれを選ぶとよ…

ExAC

Analysis of protein-coding genetic variation in 60,706 humans 91000エクソーム→フィルタリング・QC→60706人 ヨーロッパ人を大多数に、東アジア、南アジア、アフリカ、Latinoを主要サンプルとする 10195872(1千万)候補バリアントを見つけ、確度の高い740…

ぱらぱらめくる『逆問題の数学』

逆問題の数学作者: 堤正義出版社/メーカー: 共立出版発売日: 2000/03/01メディア: 単行本 クリック: 3回この商品を含むブログを見る 本の前提 リッジ回帰は、のようなデータについての値が説明変数にばらけるような割り付けをするタイプの回帰 そのときにの…

5.6 複数要因・組み合わせ、独立だったり順序があったり ぱらぱらめくる『はじめての統計データ分析』

stanファイル似て指定する モデルを書き換えて、知りたいことを生成量にすれば、なんでもできる 要因が増えるなら、モデル式の項数を増やす 複数カテゴリに順序を入れてそれらが守られているかどうかは、事後分布から発生した標本のうちそれが満足されるもの…

3.4. 2群のデータ ぱらぱらめくる『はじめての統計データ分析』

t検定が、等分散性の仮定の有無を区別するように、また、対応のありなしを区別するように、事後分布推定もそれぞれの仮定の下で行う 仮定はmodelとして指定する 等分散性の有無は、2群の分散を1つのパラメタで表すか否かで書き分ける 対応があることは、分…

2.MCMCと正規分布の推測 ぱらぱらめくる『はじめての統計データ分析』

2つの内容 MCMCによる事後分布の評価方法と解釈方法 正規分布の推測 MCMC法 推定の対象は分布を取る。データを生成する尤度に基づく事後分布である 計算によって事後分布の最尤値をもとめたり、分布の形を求めたり、区間を求めたりするのは、大変だったり不…

2−5.rstanを自由に動かす ぱらぱらめくる『はじめての統計データ分析』

教科書のコードをコピーペーストすれば、MCMCによる事後分布推定はできるけれど、条件を変えにくい 少し勉強して自由に動かしてみる rstanパッケージのstan()関数に必要なものを渡せばよい どうしても渡さないといけない引数はfile、dataの二つ fileはどうい…

2−4.rstanを動かす ぱらぱらめくる『はじめての統計データ分析』

2章のコードを動かしてみる G1mean()関数は、この教科書が提供しているstanを使う関数。以下のような設定で回るように作られている 正規分布を仮定し 正規分布のパラメタmu,sigmaをサンプリングしつつ そのほかにxaste,log_likともサンプリングする xasteは…

2−3.真偽判定 ぱらぱらめくる『はじめての統計データ分析』

事後分布を推定し、その下で(その各事後分布由来の標本の下で)、Aかnon-Aかの確率を算出すれば、事後分布全体でAかnon-Aかの確率が推定できる これを仮説検定のような意味合いで使うことも可能 ただし、帰無仮説検定では、パラメタ値が0かそれ以外かを…

2−2.データから知りたいことを言葉にする ぱらぱらめくる『はじめての統計データ分析』

2章では、データに基づいて、モデルのパラメタの事後分布を推定することを学んだけれど、それ以外にも、いろいろな「知りたいこと」の事後情報が得られる RQ(リサーチクエスチョン)と称して、複数の「知りたいこと」が列挙してあるので、その意味を確認し、…

MCMC法とサンプリングアルゴリズム ぱらぱらめくる『はじめての統計データ分析』

視覚的に理解する 酔歩しながら、うまくサンプリングする方法(ヘイスティング・ギブスサンプラー) ちょっと工夫して、広く、高採択率でサンプリングする方法(ハミルトニアン) 事後分布を推定したい データを持っている データをもたらしたはずの分布モデルも…

ぱらぱらめくる『はじめての統計データ分析』

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2016/06/02メディア: 単行本(ソフトカバー)この商品を含むブログ (11件) を見る 構成 準備 教科書のRコードが動くことの確認 まえがきと目…

1−2.ベイズと分布〜Rを使う ぱらぱらめくる『はじめての統計データ分析』

真の分布は理論分布ではない(かもしれない) 真の分布として、平均100、標準偏差10の正規分布と平均120、標準偏差30の正規分布の0.7:0.3混合分布を仮定する そのような真の分布からの500人分の観察データをシミュレート作成する n <- 500 pr <- c(0.7,0.3) Ao…

教科書のRコードが動くことの確認 ぱらぱらめくる『はじめての統計データ分析』

自身のコンピュータでRを使っている「場所」を確認する getwd() 例えば > getwd() [1] "C:/Users/ryamada/Documents" となる。"C:/Users/ryamada/Documents"でRを動かしている ダウンロードしたzipファイルを展開した結果、"C:/Users/ryamada/Desktop/stat"…

1.ベイズと分布 ぱらぱらめくる『はじめての統計データ分析』

ポイント ベイズ流では、分布を扱うこと、ベイズの定理を使うこと、事前分布が必要なこと 分布は大事であって、この本では分布を使う、ということ 分布には データ分布・標本分布がある 理論分布がある 分布を使うために知っておくべきこと データ分布と理論…

まえがきと目次を読む ぱらぱらめくる『はじめての統計データ分析』

まえがき この本では 「仮説」と「データ」を持っているときに 「仮説が正しい確率」を計算する 「仮説が正しい確率」を含め、「データ」に基づいて算出する量を「生成量」と呼ぶ 「仮説」を検定しない 目次 1. データの整理とベイズの定理 2. MCMCと正…

準備 ぱらぱらめくる『はじめての統計データ分析』

こちらを参考に、Rコードが動くようにしよう この準備でやっていること Rというソフトウェアをインストールする 『はじめての…』では、rstanという名前のパッケージを使うので、それをインストールしている rstanは統計手法的な「答え」を数学の問題を解くよ…