2016-05-01から1ヶ月間の記事一覧
昨日、階層構造を持つ確率分布のための情報幾何について少し書いた 特に、なd元分割表のためのe-平坦、m-平坦なパラメタの取り方について、丁寧に確認してみたい Rでパラメタ変換をしてみるのが、手っ取り早そうなので、それでやってみる Rmd 2重平坦パラメ…
資料 確率分布を点としてもつ多様体を統計多様体という 確率分布をn個のパラメタで表すことにすると、その統計多様体はn次元多様体 多様体には多様体固有の特徴があって、それはリーマン計量だったりするわけで、局所座標系を入れる・入れないに関わらずその…
Conventional analysis depends on independency among values Time series/ spacial data have values that are next to each other are tightly associated and this feature should be absolutely considered. At a glance
What is new? This approach requires computers, that was not available in 20th century; that is why MCMC is being used for tasks that could not be solved by the methods before and also MCMC is being used for tasks that have been answered by…
日本語説明 reading material on Bayes Statement on p-value (ASA)
Noisy because Biological phenomena are "noisy" ~ heterogeneity is the important feature of biology. Experiments have many factors that add noise to data. Highthroughput systems realize "highthoughput" by sacrificing preciseness somehow. No…
100 samples x 25000 genes You can predict perfectly when you are allowed to use explanatory variables as many as sample size. n <- 10 m <- 10 p <- sample(0:1,n,replace=TRUE) g <- matrix(sample(0:1,n*m,replace=TRUE),n,m) p g lm.out <- lm(p~…
Many genes Many features Many biomarkers 検索結果 Sparse cells with 5 markers grid; one cubicle only has 1 cell in average. It is too sparse to estimate density in a regular way. No center, no common individuals N <- 10^4 x <- runif(N)-0.5…
When you test multiple times, you should not believe nominal p-values of individual tests. 検定を複数行った場合には、個々の検定のp値をそのまま使って解釈できない p <- runif(10^5) hist(p) plot(sort(p),pch=20,cex=0.1) alpha <- 0.05 abline(v=l…
Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…
Visualization dimension reduction manifold dimension reduction
Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Challenge 1 Multiple-Comparison Issue Challenge 2 High-Dimensional Biological Data Challenge 3 Small-n and Large-p Problem Challenge 4 Noisy High-Throughput Bi…
対象(医科学修士院生1回生) 資料 Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Beyond the hype: Big data concepts, methods, and analytics Big Data Analysis Using Modern Statistical and Machine Learning Meth…
ここ数日、統計多様体とその2つの平坦なパラメタの取り方について書いている リーマン多様体として形を考えるときにRicci flowというのがあった そこにもアルファ接続が出てくる どういう関係なのか調べよう こちらに資料
資料はこちら リーマン多様体(多様体に計量が乗っている)がある そこに滑らかにつながるベクトル場がある ベクトル場を多様体上で微分したい ベクトル場の微分をするとは、「あるベクトル場」を「別のベクトル場が定める方向」について微分してやり、「新た…
dカテゴリの多項分布のフィッシャー情報量を考える は となる これは、d次元空間にあるd-1次元多様体としての球(ただし、すべての成分が0以上である象限のみ) この球はユークリッド空間にあり、球面上の点には、普通の計量(ユークリッド計量)が入れられる 実…
# (0,pi/2)の角座標 theta <- seq(from=0,to=pi/2,length=100) theta <- theta[-c(1,length(theta))] # それに対応する y1=cos(theta), p1 = y1^2なる「成功確率変数」 p <- cos(theta)^2 # 円周上での一様分布 x.theta <- rep(1,length(theta)) # それに対…
昨日、一昨日と、二項分布・ベータ分布のJeffreys priorについて書いた 無情報事前分布の一つのこと Fisher情報量の平方根がJeffreys prior このJeffreys priorの「無情報」とはどういうことか パラメタをどう取ろうとも、パラメタの値が真値であることを、…
ブログ版はこちら 私のためのJeffreys prior作者: ryamada発売日: 2016/05/13メディア: Kindle版この商品を含むブログを見る --- title: "私のためのJeffreys prior" author: "ryamada" date: "2016年5月14日" output: html_document --- # 無情報priorとし…
Rmd->epub化はこちら。 ベイズ推定によって、事後確率分布を得るときに、「無情報prior」をどうするか、という話しがある 「無情報prior」はパラメタの取り方によらないのが、よい、そうするとJeffreys priorが適当になる そのFeffreys priorっていうのは、F…
メモ 尤度関数はパラメタを動かすと連続的に変わる。その様子は多様体 尤度関数を表すパラメタは、尤度関数の多様体に張り付けた局所座標 多様体上の2点は異なるパラメタ値を持つ2つの尤度関数。その間に「距離」のようなものがあるが、「道のり」の取り方…
メモ1 メモ2 メモ3 メモ4
DNA鑑定のための区間推定作者: ryamada発売日: 2016/05/08メディア: Kindle版この商品を含むブログ (1件) を見る Rmd --- title: "区間推定_尤度比" output: html_document --- # 平均体重を推定する ## サンプルの平均値 「真実の分布」が平均50、標準偏差1…