Dually Flat Manifolds

情報幾何尤度 Dually flat 指数分布族混合分布族 KL divergence

昨日、階層構造を持つ確率分布のための情報幾何について少し書いた特に、なd元分割表のためのe-平坦、m-平坦なパラメタの取り方について、丁寧に確認してみたい Rでパラメタ変換をしてみるのが、手っ取り早そうなので、それでやってみる Rmd 2重平坦パラメ…

2016-05-20

Dually Flat Manifolds

情報幾何尤度 Dually flat 指数分布族混合分布族 KL divergence

資料確率分布を点としてもつ多様体を統計多様体という確率分布をn個のパラメタで表すことにすると、その統計多様体はn次元多様体多様体には多様体固有の特徴があって、それはリーマン計量だったりするわけで、局所座標系を入れる・入れないに関わらずその…

2016-05-19

時系列・空間とkrigingとか Time-series/Space and krigign etc.

時系列空間 kriging

Conventional analysis depends on independency among values Time series/ spacial data have values that are next to each other are tightly associated and this feature should be absolutely considered. At a glance

2016-05-19

MCMC

MCMC BUGS

What is new? This approach requires computers, that was not available in 20th century; that is why MCMC is being used for tasks that could not be solved by the methods before and also MCMC is being used for tasks that have been answered by…

2016-05-19

検定からベイズ推定へ Frequentist approach ~ tests and Bayesian approach

Bayes Frequentist

日本語説明 reading material on Bayes Statement on p-value (ASA)

2016-05-19

Noisy High-Throughput Biological Data

ノイズ

Noisy because Biological phenomena are "noisy" ~ heterogeneity is the important feature of biology. Experiments have many factors that add noise to data. Highthroughput systems realize "highthoughput" by sacrificing preciseness somehow. No…

2016-05-19

small n large p

100 samples x 25000 genes You can predict perfectly when you are allowed to use explanatory variables as many as sample size. n <- 10 m <- 10 p <- sample(0:1,n,replace=TRUE) g <- matrix(sample(0:1,n*m,replace=TRUE),n,m) p g lm.out <- lm(p~…

2016-05-19

High Dimensionality

Multiple testing

Many genes Many features Many biomarkers 検索結果 Sparse cells with 5 markers grid; one cubicle only has 1 cell in average. It is too sparse to estimate density in a regular way. No center, no common individuals N <- 10^4 x <- runif(N)-0.5…

2016-05-19

Multiple-Comparison Issue

Multiple testing p値 q値

When you test multiple times, you should not believe nominal p-values of individual tests. 検定を複数行った場合には、個々の検定のp値をそのまま使って解釈できない p <- runif(10^5) hist(p) plot(sort(p),pch=20,cex=0.1) alpha <- 0.05 abline(v=l…

2016-05-19

手法・目的の分類オーバービュー〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

バイオインフォマティクス統計学頻度主義ベイズ MCMC p値 q値再現性 kriging

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…

2016-05-19

High/multi-dimensional data analysis

次元

Visualization dimension reduction manifold dimension reduction

2016-05-19

どんなことが課題か〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

バイオインフォマティクス統計学頻度主義ベイズ MCMC p値 q値再現性 kriging

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Challenge 1 Multiple-Comparison Issue Challenge 2 High-Dimensional Biological Data Challenge 3 Small-n and Large-p Problem Challenge 4 Noisy High-Throughput Bi…

2016-05-19

90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

バイオインフォマティクス統計学頻度主義ベイズ MCMC p値 q値再現性 kriging

対象(医科学修士院生１回生) 資料 Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Beyond the hype: Big data concepts, methods, and analytics Big Data Analysis Using Modern Statistical and Machine Learning Meth…

2016-05-18

Ricci flowとアルファ接続

情報幾何曲率 Ricci flow

ここ数日、統計多様体とその２つの平坦なパラメタの取り方について書いているリーマン多様体として形を考えるときにRicci flowというのがあったそこにもアルファ接続が出てくるどういう関係なのか調べようこちらに資料

2016-05-17

情報幾何 Affine接続捩れ双対接続双対平坦

情報幾何 Affine接続双対双対接続双対平坦

資料はこちらリーマン多様体(多様体に計量が乗っている)があるそこに滑らかにつながるベクトル場があるベクトル場を多様体上で微分したいベクトル場の微分をするとは、「あるベクトル場」を「別のベクトル場が定める方向」について微分してやり、「新た…

2016-05-16

Fisher情報量と正単体と球

二項分布ベータ分布 Fisher情報量 Jeffreys prior 正単体球

dカテゴリの多項分布のフィッシャー情報量を考えるはとなるこれは、d次元空間にあるd-1次元多様体としての球(ただし、すべての成分が0以上である象限のみ) この球はユークリッド空間にあり、球面上の点には、普通の計量(ユークリッド計量)が入れられる実…

2016-05-16

ベータ分布を円周に描く

ベータ分布円 Jeffreys prior

# (0,pi/2)の角座標 theta <- seq(from=0,to=pi/2,length=100) theta <- theta[-c(1,length(theta))] # それに対応する y1=cos(theta), p1 = y1^2なる「成功確率変数」 p <- cos(theta)^2 # 円周上での一様分布 x.theta <- rep(1,length(theta)) # それに対…

2016-05-15

Fisher情報量とJeffreys prior

二項分布ベータ分布 Fisher情報量 Jeffreys prior

昨日、一昨日と、二項分布・ベータ分布のJeffreys priorについて書いた無情報事前分布の一つのこと Fisher情報量の平方根がJeffreys prior このJeffreys priorの「無情報」とはどういうことかパラメタをどう取ろうとも、パラメタの値が真値であることを、…

2016-05-14

Fisher情報量とJeffreys prior

二項分布ベータ分布 Fisher情報量 Jeffreys prior

ブログ版はこちら私のためのJeffreys prior作者: ryamada発売日: 2016/05/13メディア: Kindle版この商品を含むブログを見る --- title: "私のためのJeffreys prior" author: "ryamada" date: "2016年5月14日" output: html_document --- # 無情報priorとし…

2016-05-13

Fisher情報量とJeffreys prior

二項分布ベータ分布 Fisher情報量 Jeffreys prior

Rmd->epub化はこちら。ベイズ推定によって、事後確率分布を得るときに、「無情報prior」をどうするか、という話しがある「無情報prior」はパラメタの取り方によらないのが、よい、そうするとJeffreys priorが適当になるそのFeffreys priorっていうのは、F…

2016-05-11

Fisher 情報量リーマン計量 Jeffreys Prior KL情報量

KL divergence フィッシャー情報量リーマン計量 Jeffreys prior

メモ尤度関数はパラメタを動かすと連続的に変わる。その様子は多様体尤度関数を表すパラメタは、尤度関数の多様体に張り付けた局所座標多様体上の２点は異なるパラメタ値を持つ２つの尤度関数。その間に「距離」のようなものがあるが、「道のり」の取り方…

2016-05-10

Jeffrey's prior

メモ1 メモ2 メモ3 メモ4

2016-05-09

■

R DNA鑑定区間推定 R DNA鑑定区間推定

DNA鑑定のための区間推定作者: ryamada発売日: 2016/05/08メディア: Kindle版この商品を含むブログ (1件) を見る Rmd --- title: "区間推定_尤度比" output: html_document --- # 平均体重を推定する ## サンプルの平均値「真実の分布」が平均50、標準偏差1…

ryamadaの遺伝学・遺伝統計学メモ

2016-05-01から1ヶ月間の記事一覧

Dually Flat Manifolds

Dually Flat Manifolds

時系列・空間とkrigingとか Time-series/Space and krigign etc.

MCMC

検定からベイズ推定へ Frequentist approach ~ tests and Bayesian approach

Noisy High-Throughput Biological Data

small n large p

High Dimensionality

Multiple-Comparison Issue

手法・目的の分類オーバービュー〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

High/multi-dimensional data analysis

どんなことが課題か〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Ricci flowとアルファ接続

情報幾何 Affine接続捩れ双対接続双対平坦

Fisher情報量と正単体と球

ベータ分布を円周に描く

Fisher情報量とJeffreys prior

Fisher情報量とJeffreys prior

Fisher情報量とJeffreys prior

Fisher 情報量リーマン計量 Jeffreys Prior KL情報量

Jeffrey's prior

■