インフォグラフィックとデータ視覚化

[データ視覚化][インフォグラフィック] データ視覚化とインフォグラフィック。統計学・データサイエンスの分野では、データを解りやすく伝える技術としてデータ視覚化(data visualization)もあります両者には似ている点もありますが、異なる点もあります。…

2018-09-04

引越しました

2018/09/04に引っ越しました。引越し後(はてなブログ) 引越し前(はてなダイアリー)

2018-09-01

ノンパラ・ベイズ夏休み集中セミナーメモ

ノンパラメトリックベイズノンパラメトリックベイズ

９月１日パラとノンパラの基礎概念資料１『Parametric vs Nonparametric Models』パラは有限個パラメタ、ノンパラは無限個パラメタのモデル無限個パラメタのモデルとはどういうことかをわかることが大事ノンパラベイズは無限個パラメタを想定しつつ、実…

2018-09-01

ノンパラ・ベイズ夏休み集中セミナーメモ０

ノンパラメトリックベイズノンパラメトリックベイズ

予定９月１日(パラとノンパラの基礎概念。ノンパラ検定) ９月１７日(ノンパラ・ベイズの短いチュートリアル) ９月２２日(長文資料のつまみ食い。R・パイソンで遊ぶ、その１) ９月２４日(長文資料のつまみ食い。R・パイソンで遊ぶ、その２) 参加者 A(統計遺…

2018-07-07

6 General Posterior Distribution 一般化した場合ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

Algebraic geometric transformにより、standard form(５章の形)に持ち込めることを示すとなれば、５章で示したStandard formの色々な良い性質がそのまま使える(らしい)

2018-07-07

5 Standard Posterior Distribution 事後分布が正規分布の場合ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

モデルが真の分布を含み、推定にあたり、漸近的に正規分布を想定できる場合は簡単。ベイズ推定と最尤推定とがほぼ一致するから真の分布は正規分布とはみなせないことも多く、その場合は、ベイズ推定のあてはまりがよくなると一般化できる(そうだ) この章で…

2018-07-07

3 Basic Formula of Bayesian Observables 観測量のベイズにおける基礎的な式ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

(1) 真の分布と統計モデルの関係の定義をする (2) 観測変数のベイズ流定義とのそのnormalized version (3) ベイズ予測のキュムラント母関数の定義 (4) ベイズ統計の基礎的な理論事項をキュムラント母関数を用いて証明する(それにより、真の分布とモデルと予…

2018-07-07

1 ベイズ統計の基礎ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

真の分布の事前分布があって、それぞれがある観測をもたらす確率がわかっていれば、観測から真の分布の事後分布が計算できる、というのがベイズの定理残念ながら、事前分布も正確には解らないし、観測をもたらす確率も解っていない(のでモデルを入れる)から…

2018-07-07

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

2018-07-06

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

ぱらぱらめくるシリーズベイズ数学

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

2018-05-15

固有値分解する

R 最小二乗法

の最小化の最小化 Mの最小固有値に対応する固有ベクトルが一番拡大率が小さいから、その固有ベクトル方向のが求める解 n <- 100 X <- matrix(rnorm(n*2),ncol=2) Y <- X %*% c(1,2) + rnorm(n,0,0.01) library(rgl) plot3d(X[,1],X[,2],Y) lm(Y ~ X-1) XY <…

2018-03-21

メモ

ごちゃごちゃと考えたときのメモ普通のポアソン分布は非負整数を台としてその上に非負実数を配するルールをパラメタ依存に定める。そういう意味で、パラメトリックな確率分布とは、「ある台」に総和(全体の積分)が１になるような確率質量・密度を定めるルー…

2018-03-21

ぱらぱらめくる『The Ubiquitous Ewens Sampling Formula』

ぱらぱらめくるシリーズ Ewens's sampling formula 中華料理店過程 Poisson-Dirichlet過程ノンパラメトリックベイズ

ペイパーはこちら Ewens sampling formulaは遺伝統計学分野から出た正確確率計算式で、ある理想集団におけるアレル頻度パターンが生じる確率の式であるが、それは離散確率過程において応用範囲が広いものであり、遺伝学・生物学の中では、アレル頻度だけでな…

2018-03-20

ポアソン点過程・分割・ノンパラメトリックベイズ

ポアソン点過程分割ノンパラメトリックベイズ

動機色々動機はあるかもしれないが多数のもの・無限個あるかもしれないもののタイプ分けが興味の対象クラスタ数不定な状況でのクラスタリングそのための確率モデルその確率モデルの下での生起確率・事前確率・尤度・事後確率モデル具体的な説明から始…

2018-03-19

Ewens sampling formula

Ewens sampling formulaは、集団のハプロタイプ生成状況にある条件を課したときに、標本の頻度分布の正確確率に関する式これは集団遺伝学の領域では、最も単純な条件でのCoalescent過程が生成する頻度分布になる Coalescent過程は頻度分布のみを定めるだけ…

2018-03-17

Poisson 点過程で作る Random Exchangeable Partitions

Random Exchangeable Partitions Poisson Dirichlet過程 Coalescent Size-biased Pick

Stick breaking process/中華料理店過程でExchangeable random partitionsが作れることを前の記事で書いた同じことを別の作り方として表現できる正の値をランダムに発生させ、その総和が1になるように標準化すれば、足して1になる多数の(無限の)正の数の集…

2018-03-17

Random Exchangeable Partitions

Random Exchangeable Partitions Poisson Dirichlet過程 Coalescent Size-biased Pick

Random Exchangeable Partitions Partition(分割)を考える何を分割するのかが問題になる。ある正の整数Nを分割する。このときという集合を排他的な部分集合に分割する、という考え方もあるが、それだと、「1から正の整数Nまでの整数集合を分割する」と表現…

2018-03-17

確率的に単位線分を分割し続けて作る Random Exchangeable Partitions

Random Exchangeable Partitions Poisson Dirichlet過程 Coalescent Size-biased Pick

長さ１の単位線分をあるルールで確率的に分割していけば、それもRandom Exchangeable Partitionsとなる Poisson-Dirichlet Processと呼ばれる方法がその一つで、よく研究されている何度でも分割し続けるルールとして、単位線分から出発して、分割点を１点と…

2018-03-17

確率質量分布で表すRandom Exchangeable Partitions

Random Exchangeable Partitions Poisson Dirichlet過程 Coalescent Size-biased Pick

Kingmanのpaintbox〜単位線分タイリングがrandom exchangeable partitionsの表現であることがわかったが、実際、どんなrandom exchangeale partitionsが現れるのかは確率事象なので確率事象として生成されるときにどんな確率事象なのか、そのときにどのよう…

2018-03-17

Kingman's theorem、Random Exchangeable Partitions

Random Exchangeable Partitions Poisson Dirichlet過程 Coalescent Size-biased Pick Kingman

無限大()のRandom Exchangeable Partitions 限大にするとちょっと厄介こんな方法(KingmanのPaintboxの方法)というのがある 1,2,...,Nという数列を長さ１の線分に見立てて、それを分割するただし、Nは無限大なのでこの線分上には無限個の自然数が並んでいる…

2018-03-15

ポアソン・ディリクレ過程とハプロタイプ頻度

ハプロタイプポアソン・ディリクレ過程ポアソン過程ディリクレ分布

サンプリングして有限個数の多項分布を生み出すことに関するものと、長さ１を分割する・無限分割することに関するものに大きく２分され、その２つが相互に関連する、という構図になっている中華料理店過程とその一般化としてのピットマン・ヨー過程多項標…

2018-03-06

Priorを調整しながらベイズ

ベイズ事前分布

あるpriorでMCMCベイズを回して事後分布を得るとするそのpriorは、ある基準で選ばれたpriorだが、別の基準だと「変数変換」しないといけないとするそんなpriorの重み変換をすることができるのか、できるならどうやるのかの調べものこちらは、この用に適し…

2018-02-28

FDR: Benjamini-Hockberg

FDR Knockoff Benjamini-Hochberg

昨日の記事はKnockoff 変数を用いたFDRの制御の話 FDRといえば、Benjamini-Hochbergもあるこれは、「ある閾値で変数の取捨選択をするとする」ときに、すべの変数が帰無仮説ＯＫ変数だったとした場合に、何個の変数がFalselyに帰無仮説を棄却するかの期待個…

2018-02-27

Knockoff 変数

Knockoff

Knockoff 変数を使ったFDRについての概説記事はこちら説明変数 Xがnxp行列(nサンプル、p個の説明変数)であるときにこの形は2p個の変数の分散共分散行列になっており、Positive definite したがって、(対角行列)の取り方に制約があるその制約がある中で、…

2018-02-27

Knockoff 変数によるFDR

Knockoff FDR PPV

資料はこれ(基本)とこれ(GWAS等への拡張) Rのパッケージはknockoffで、そのgithubがこちら考え方の基本 FDRをしたい多変量解析をしていて、いくつかの変量は従属変量に意味のある寄与があり、残りの変量は意味がない、というように振り分けたいその振り分…

2018-02-17

ぱらぱらめくる『遺伝子親密なる人類史』

遺伝学ぱらぱらめくるシリーズ

遺伝子‐親密なる人類史‐ 上作者: シッダールタムカジー,Siddhartha Mukherjee,仲野徹,田中文出版社/メーカー: 早川書房発売日: 2018/02/06メディア: 単行本この商品を含むブログ (4件) を見る遺伝子‐親密なる人類史‐ 下作者: シッダールタムカジー,Siddharth…

2018-02-06

乗法的更新アルゴリズム

乗法的更新アルゴリズム非負値行列因子分解 NMF

どうして乗法的と言うか複数のアドバイザが居るときに、そのアドバイザのアドバイスを使って何かの決断をするとする決断の結果がよいこともあるだろうし、悪いこともあるだろう決断の結果のよしあしを持って、アドバイザに信用を置くかどうか・アドバイザ…

2018-02-03

ダイバージェンス

ダイバージェンス divergence 情報幾何

こちらにいろいろなダイバージェンス(２点間の遠近を数値化する方法)について書かれているぱらぱらめくってメモってみる大きく２つある Bregman divergence f-divergence 両者の交わりに、α-divergenceがあり、その一つがKLdivergence Bregman divergence …