2018-01-01から1ヶ月間の記事一覧

Data Structure for Human Cell Atlas-like Project Part 2

昨日の記事でHuman Cell Atlasのデータ構造についてメモした 今日の記事では確率モデルにするにあたっての原則について考える 確率変数 観察というイベントごとに確率変数を定める 確率変数は単項か複数項かで設定に(多少の)違いを要する 単項の場合 量的 パ…

Data Structure for Human Cell Atlas-like Project

昨日の記事でHuman Cell Atlasのことを書いた 例 Example Aさんの臓器Bから臓器片Cを取り出し、1細胞にばらして/臓器片中の相対的位置情報を取りつつ、細胞集合とし、個々の細胞について1細胞オミクス解析をして、ゲノム・エピゲノム・トランスクリプトーム…

ぱらぱらめくる『The Human Cell Atlas White Paper』

Human Cell Atlas プロジェクト Human Cell Atlas White Paper SUMMARY 目的と現時点の解釈 ヒトの全細胞に関するレファレンスマップを作成し、生命現象、疾患の診断・モニタリング・治療に関する理解を深めるとともに、遺伝的多様性に紐づく表現型多様性(特…

Maximum Mean DIscrepancy その3

Rのkernlab library(kernlab) # create data x <- matrix(runif(300),100) y <- matrix(runif(300)+1,100) mmdo <- kmmd(x, y) mmdo > mmdo Kernel Maximum Mean Discrepancy object of class "kmmd" Gaussian Radial Basis kernel function. Hyperparameter…

フーリエ、巻きつける

分布関数があったときに、としてやるとモーメント母関数。が実数tに関して無限の広がりを持つので、無限に複雑な分布関数の情報を担わせることができる ちょっと変える。。これは特性関数。複素数を導入することで、無限遠まで伸びる実数直線を単位円周に「…

ぱらぱらめくる『カーネル法入門』

カーネル法入門―正定値カーネルによるデータ解析 (シリーズ 多変量データの統計科学)作者: 福水健次出版社/メーカー: 朝倉書店発売日: 2010/11/01メディア: 単行本 クリック: 19回この商品を含むブログ (11件) を見る 章末にまとめが書いてある。それをかい…

特性関数・指数型分布族・情報幾何

メモ的なRmdファイル --- title: "特性関数・指数型分布族・情報幾何" author: "ryamada" date: "2018年1月18日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)…

カーネル法?KL divergence?

メモ的なRmdファイル --- title: "カーネル法?KL divergence?" author: "ryamada" date: "2018年1月17日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` …

確率密度関数同士の内積

標本から確率変数の分布を推定することがある パラメトリックな推定では分布の型を決め、その型を表すパラメタの最尤推定などを行って特定の分布であると推定する ノンパラメトリックな推定の一つにカーネル法がある。あるローカルな確率密度は、その知りた…

特性関数

確率密度分布があったときに、特性関数というものがある 分布を一意に確定するものとして密度分布があるが、それの双対になっている特性関数も分布を一意に決めるよ、という話 確率変数 X があったときに、を特性関数と言うよ、とのこと このはのこと これは…

メモ

確率密度関数⇔特性関数 (フーリエ変換、双対、) キュムラント母関数は、2つの定義(こちら) 積率母関数の自然対数 特性関数の自然対数 いずれも、確率変数のモーメントを保持している 指数型分布族の場合、log-partition 関数(正規化項に対する関数,)は、キ…

特性関数

確率変数Xがあるという。たとえば正規分布に従う変数。 確率密度関数が書けたりする 今、Xと関係する別の確率変数Yを考える ただし、Yは 複素数である 実数変数tによって変わるものとする 実際と定める この複素確率変数には「平均〜期待値」がある この期待…

kernlab パッケージ

カーネル法の代表格がサポートベクターマシン サポートベクターマシンの実装はC/C++,MATLABにもあり、Rでもe1071にそのカウンターパートがある サポートベクターマシン以外にもカーネル法の使い道はある カーネル法一般利用をするための諸関数を提供するのが…

MMDでマイクロアレイ発現解析

MMD

Integrating structured biological data by Kernel Maximum Mean Discrepancy

MMDでChIP seq解析

MMDiff2パッケージ source("https://bioconductor.org/biocLite.R") biocLite("MMDiff2") library('MMDiff2') library('MMDiffBamSubset') ExperimentData <- list(genome='BSgenome.Mmusculus.UCSC.mm9', dataDir=system.file("extdata", package="MMDiffBa…

カーネル平均を用いた統計的推論

統計的推論は確率Pに関する推論問題だが、それと1対1対応するRKHSの関数(ベクトル)であるカーネル平均に関する推論問題とみなせる 2標本問題であれば、2つのカーネル平均が同じか否かと言う問題になる 独立性検定であれば、同時分布のカーネル平均が、個…

カーネル平均

カーネル関数 を定めると、それに対応して、このカーネル関数を内積とする関数のヒルベルト空間が定まる の集合から、このヒルベルト空間(の関数)への写像があるわけであるが、このに対応する関数をと書いたりと書いたりする 今、確率変数がの集合(空間)にあ…

カーネル法

カーネル法は、一般化した定義があるが、一般化した話をするとイメージが湧かないので、具体例に即して書いて、そこに(可能な範囲で)一般化したときにどういうことかということを書き添えることにする 正定値カーネル関数(Wiki) カーネル関数というのがある…

Maximum Mean Discrepancy

こちらの資料は「カーネル法入門」のうちの「カーネル平均を用いたノンパラメトリック推論」と題されたPDF そのなかにMaximum Mean Discrepancyの定義が出て来るらしい 確率変数(の観測標本)があるときに、そこにノンパラに分布推定をするつもりながら、分布…