2018-01-01から1年間の記事一覧

Poisson 点過程で作る Random Exchangeable Partitions

Stick breaking process/中華料理店過程でExchangeable random partitionsが作れることを前の記事で書いた 同じことを別の作り方として表現できる 正の値をランダムに発生させ、その総和が1になるように標準化すれば、足して1になる多数の(無限の)正の数の集…

Random Exchangeable Partitions

Random Exchangeable Partitions Partition(分割)を考える 何を分割するのかが問題になる。ある正の整数Nを分割する。このときという集合を排他的な部分集合に分割する、という考え方もあるが、それだと、「1から正の整数Nまでの整数集合を分割する」と表現…

確率的に単位線分を分割し続けて作る Random Exchangeable Partitions

長さ1の単位線分をあるルールで確率的に分割していけば、それもRandom Exchangeable Partitionsとなる Poisson-Dirichlet Processと呼ばれる方法がその一つで、よく研究されている 何度でも分割し続けるルールとして、単位線分から出発して、分割点を1点と…

確率質量分布で表すRandom Exchangeable Partitions

Kingmanのpaintbox〜単位線分タイリングがrandom exchangeable partitionsの表現であることがわかったが、実際、どんなrandom exchangeale partitionsが現れるのかは確率事象なので 確率事象として生成されるときにどんな確率事象なのか、そのときにどのよう…

Kingman's theorem、Random Exchangeable Partitions

無限大()のRandom Exchangeable Partitions 限大にするとちょっと厄介 こんな方法(KingmanのPaintboxの方法)というのがある 1,2,...,Nという数列を長さ1の線分に見立てて、それを分割する ただし、Nは無限大なのでこの線分上には無限個の自然数が並んでいる…

ポアソン・ディリクレ過程とハプロタイプ頻度

サンプリングして有限個数の多項分布を生み出すことに関するものと、長さ1を分割する・無限分割することに関するものに大きく2分され、その2つが相互に関連する、という構図になっている 中華料理店過程とその一般化としてのピットマン・ヨー過程 多項標…

Priorを調整しながらベイズ

あるpriorでMCMCベイズを回して事後分布を得るとする そのpriorは、ある基準で選ばれたpriorだが、別の基準だと「変数変換」しないといけないとする そんなpriorの重み変換をすることができるのか、できるならどうやるのかの調べもの こちらは、この用に適し…

FDR: Benjamini-Hockberg

昨日の記事はKnockoff 変数を用いたFDRの制御の話 FDRといえば、Benjamini-Hochbergもある これは、「ある閾値で変数の取捨選択をするとする」ときに、すべの変数が帰無仮説OK変数だったとした場合に、何個の変数がFalselyに帰無仮説を棄却するかの期待個…

Knockoff 変数

Knockoff 変数を使ったFDRについての概説記事はこちら 説明変数 Xがnxp行列(nサンプル、p個の説明変数)であるときに この形は2p個の変数の分散共分散行列になっており、Positive definite したがって、(対角行列)の取り方に制約がある その制約がある中で、…

Knockoff 変数によるFDR

資料はこれ(基本)とこれ(GWAS等への拡張) Rのパッケージはknockoffで、そのgithubがこちら 考え方の基本 FDRをしたい 多変量解析をしていて、いくつかの変量は従属変量に意味のある寄与があり、残りの変量は意味がない、というように振り分けたい その振り分…

ぱらぱらめくる『遺伝子 親密なる人類史』

遺伝子‐親密なる人類史‐ 上作者: シッダールタムカジー,Siddhartha Mukherjee,仲野徹,田中文出版社/メーカー: 早川書房発売日: 2018/02/06メディア: 単行本この商品を含むブログ (4件) を見る遺伝子‐親密なる人類史‐ 下作者: シッダールタムカジー,Siddharth…

乗法的更新アルゴリズム

どうして乗法的と言うか 複数のアドバイザが居るときに、そのアドバイザのアドバイスを使って何かの決断をするとする 決断の結果がよいこともあるだろうし、悪いこともあるだろう 決断の結果のよしあしを持って、アドバイザに信用を置くかどうか・アドバイザ…

ダイバージェンス

こちらにいろいろなダイバージェンス(2点間の遠近を数値化する方法)について書かれている ぱらぱらめくってメモってみる 大きく2つある Bregman divergence f-divergence 両者の交わりに、α-divergenceがあり、その一つがKLdivergence Bregman divergence …

エントロピーと幾何平均

という積分がある。pが確率密度分布であるとき、この積分はKLdの計算の基礎となっているし、はエントロピーである。 の期待値とも読めるこのであるが、離散的な場合のは次のように式変形できる(こちら) この右辺が重み付き幾何平均であることが知られており…

Data Structure for Human Cell Atlas-like Project Part 2

昨日の記事でHuman Cell Atlasのデータ構造についてメモした 今日の記事では確率モデルにするにあたっての原則について考える 確率変数 観察というイベントごとに確率変数を定める 確率変数は単項か複数項かで設定に(多少の)違いを要する 単項の場合 量的 パ…

Data Structure for Human Cell Atlas-like Project

昨日の記事でHuman Cell Atlasのことを書いた 例 Example Aさんの臓器Bから臓器片Cを取り出し、1細胞にばらして/臓器片中の相対的位置情報を取りつつ、細胞集合とし、個々の細胞について1細胞オミクス解析をして、ゲノム・エピゲノム・トランスクリプトーム…

ぱらぱらめくる『The Human Cell Atlas White Paper』

Human Cell Atlas プロジェクト Human Cell Atlas White Paper SUMMARY 目的と現時点の解釈 ヒトの全細胞に関するレファレンスマップを作成し、生命現象、疾患の診断・モニタリング・治療に関する理解を深めるとともに、遺伝的多様性に紐づく表現型多様性(特…

Maximum Mean DIscrepancy その3

Rのkernlab library(kernlab) # create data x <- matrix(runif(300),100) y <- matrix(runif(300)+1,100) mmdo <- kmmd(x, y) mmdo > mmdo Kernel Maximum Mean Discrepancy object of class "kmmd" Gaussian Radial Basis kernel function. Hyperparameter…

フーリエ、巻きつける

分布関数があったときに、としてやるとモーメント母関数。が実数tに関して無限の広がりを持つので、無限に複雑な分布関数の情報を担わせることができる ちょっと変える。。これは特性関数。複素数を導入することで、無限遠まで伸びる実数直線を単位円周に「…

ぱらぱらめくる『カーネル法入門』

カーネル法入門―正定値カーネルによるデータ解析 (シリーズ 多変量データの統計科学)作者: 福水健次出版社/メーカー: 朝倉書店発売日: 2010/11/01メディア: 単行本 クリック: 19回この商品を含むブログ (11件) を見る 章末にまとめが書いてある。それをかい…

特性関数・指数型分布族・情報幾何

メモ的なRmdファイル --- title: "特性関数・指数型分布族・情報幾何" author: "ryamada" date: "2018年1月18日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)…

カーネル法?KL divergence?

メモ的なRmdファイル --- title: "カーネル法?KL divergence?" author: "ryamada" date: "2018年1月17日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` …

確率密度関数同士の内積

標本から確率変数の分布を推定することがある パラメトリックな推定では分布の型を決め、その型を表すパラメタの最尤推定などを行って特定の分布であると推定する ノンパラメトリックな推定の一つにカーネル法がある。あるローカルな確率密度は、その知りた…

特性関数

確率密度分布があったときに、特性関数というものがある 分布を一意に確定するものとして密度分布があるが、それの双対になっている特性関数も分布を一意に決めるよ、という話 確率変数 X があったときに、を特性関数と言うよ、とのこと このはのこと これは…

メモ

確率密度関数⇔特性関数 (フーリエ変換、双対、) キュムラント母関数は、2つの定義(こちら) 積率母関数の自然対数 特性関数の自然対数 いずれも、確率変数のモーメントを保持している 指数型分布族の場合、log-partition 関数(正規化項に対する関数,)は、キ…

特性関数

確率変数Xがあるという。たとえば正規分布に従う変数。 確率密度関数が書けたりする 今、Xと関係する別の確率変数Yを考える ただし、Yは 複素数である 実数変数tによって変わるものとする 実際と定める この複素確率変数には「平均〜期待値」がある この期待…

kernlab パッケージ

カーネル法の代表格がサポートベクターマシン サポートベクターマシンの実装はC/C++,MATLABにもあり、Rでもe1071にそのカウンターパートがある サポートベクターマシン以外にもカーネル法の使い道はある カーネル法一般利用をするための諸関数を提供するのが…

MMDでマイクロアレイ発現解析

MMD

Integrating structured biological data by Kernel Maximum Mean Discrepancy

MMDでChIP seq解析

MMDiff2パッケージ source("https://bioconductor.org/biocLite.R") biocLite("MMDiff2") library('MMDiff2') library('MMDiffBamSubset') ExperimentData <- list(genome='BSgenome.Mmusculus.UCSC.mm9', dataDir=system.file("extdata", package="MMDiffBa…

カーネル平均を用いた統計的推論

統計的推論は確率Pに関する推論問題だが、それと1対1対応するRKHSの関数(ベクトル)であるカーネル平均に関する推論問題とみなせる 2標本問題であれば、2つのカーネル平均が同じか否かと言う問題になる 独立性検定であれば、同時分布のカーネル平均が、個…