2016-05-01から1ヶ月間の記事一覧

Dually Flat Manifolds

昨日、階層構造を持つ確率分布のための情報幾何について少し書いた 特に、なd元分割表のためのe-平坦、m-平坦なパラメタの取り方について、丁寧に確認してみたい Rでパラメタ変換をしてみるのが、手っ取り早そうなので、それでやってみる Rmd 2重平坦パラメ…

Dually Flat Manifolds

資料 確率分布を点としてもつ多様体を統計多様体という 確率分布をn個のパラメタで表すことにすると、その統計多様体はn次元多様体 多様体には多様体固有の特徴があって、それはリーマン計量だったりするわけで、局所座標系を入れる・入れないに関わらずその…

時系列・空間とkrigingとか Time-series/Space and krigign etc.

Conventional analysis depends on independency among values Time series/ spacial data have values that are next to each other are tightly associated and this feature should be absolutely considered. At a glance

MCMC

What is new? This approach requires computers, that was not available in 20th century; that is why MCMC is being used for tasks that could not be solved by the methods before and also MCMC is being used for tasks that have been answered by…

検定からベイズ推定へ Frequentist approach ~ tests and Bayesian approach

日本語説明 reading material on Bayes Statement on p-value (ASA)

Noisy High-Throughput Biological Data

Noisy because Biological phenomena are "noisy" ~ heterogeneity is the important feature of biology. Experiments have many factors that add noise to data. Highthroughput systems realize "highthoughput" by sacrificing preciseness somehow. No…

small n large p

100 samples x 25000 genes You can predict perfectly when you are allowed to use explanatory variables as many as sample size. n <- 10 m <- 10 p <- sample(0:1,n,replace=TRUE) g <- matrix(sample(0:1,n*m,replace=TRUE),n,m) p g lm.out <- lm(p~…

High Dimensionality

Many genes Many features Many biomarkers 検索結果 Sparse cells with 5 markers grid; one cubicle only has 1 cell in average. It is too sparse to estimate density in a regular way. No center, no common individuals N <- 10^4 x <- runif(N)-0.5…

Multiple-Comparison Issue

When you test multiple times, you should not believe nominal p-values of individual tests. 検定を複数行った場合には、個々の検定のp値をそのまま使って解釈できない p <- runif(10^5) hist(p) plot(sort(p),pch=20,cex=0.1) alpha <- 0.05 abline(v=l…

手法・目的の分類オーバービュー〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…

High/multi-dimensional data analysis

Visualization dimension reduction manifold dimension reduction

どんなことが課題か〜90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Challenge 1 Multiple-Comparison Issue Challenge 2 High-Dimensional Biological Data Challenge 3 Small-n and Large-p Problem Challenge 4 Noisy High-Throughput Bi…

90分で学ぶ医学・ライフサイエンスの統計学手法のいまどき

対象(医科学修士院生1回生) 資料 Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Beyond the hype: Big data concepts, methods, and analytics Big Data Analysis Using Modern Statistical and Machine Learning Meth…

Ricci flowとアルファ接続

ここ数日、統計多様体とその2つの平坦なパラメタの取り方について書いている リーマン多様体として形を考えるときにRicci flowというのがあった そこにもアルファ接続が出てくる どういう関係なのか調べよう こちらに資料

情報幾何 Affine接続 捩れ双対接続 双対平坦

資料はこちら リーマン多様体(多様体に計量が乗っている)がある そこに滑らかにつながるベクトル場がある ベクトル場を多様体上で微分したい ベクトル場の微分をするとは、「あるベクトル場」を「別のベクトル場が定める方向」について微分してやり、「新た…

Fisher情報量と正単体と球

dカテゴリの多項分布のフィッシャー情報量を考える は となる これは、d次元空間にあるd-1次元多様体としての球(ただし、すべての成分が0以上である象限のみ) この球はユークリッド空間にあり、球面上の点には、普通の計量(ユークリッド計量)が入れられる 実…

ベータ分布を円周に描く

# (0,pi/2)の角座標 theta <- seq(from=0,to=pi/2,length=100) theta <- theta[-c(1,length(theta))] # それに対応する y1=cos(theta), p1 = y1^2なる「成功確率変数」 p <- cos(theta)^2 # 円周上での一様分布 x.theta <- rep(1,length(theta)) # それに対…

Fisher情報量とJeffreys prior

昨日、一昨日と、二項分布・ベータ分布のJeffreys priorについて書いた 無情報事前分布の一つのこと Fisher情報量の平方根がJeffreys prior このJeffreys priorの「無情報」とはどういうことか パラメタをどう取ろうとも、パラメタの値が真値であることを、…

Fisher情報量とJeffreys prior

ブログ版はこちら 私のためのJeffreys prior作者: ryamada発売日: 2016/05/13メディア: Kindle版この商品を含むブログを見る --- title: "私のためのJeffreys prior" author: "ryamada" date: "2016年5月14日" output: html_document --- # 無情報priorとし…

Fisher情報量とJeffreys prior

Rmd->epub化はこちら。 ベイズ推定によって、事後確率分布を得るときに、「無情報prior」をどうするか、という話しがある 「無情報prior」はパラメタの取り方によらないのが、よい、そうするとJeffreys priorが適当になる そのFeffreys priorっていうのは、F…

Fisher 情報量 リーマン計量 Jeffreys Prior KL情報量

メモ 尤度関数はパラメタを動かすと連続的に変わる。その様子は多様体 尤度関数を表すパラメタは、尤度関数の多様体に張り付けた局所座標 多様体上の2点は異なるパラメタ値を持つ2つの尤度関数。その間に「距離」のようなものがあるが、「道のり」の取り方…

Jeffrey's prior

メモ1 メモ2 メモ3 メモ4

DNA鑑定のための区間推定作者: ryamada発売日: 2016/05/08メディア: Kindle版この商品を含むブログ (1件) を見る Rmd --- title: "区間推定_尤度比" output: html_document --- # 平均体重を推定する ## サンプルの平均値 「真実の分布」が平均50、標準偏差1…