Data Structure for Human Cell Atlas-like Project

昨日の記事でHuman Cell Atlasのことを書いた 例 Example Aさんの臓器Bから臓器片Cを取り出し、1細胞にばらして/臓器片中の相対的位置情報を取りつつ、細胞集合とし、個々の細胞について1細胞オミクス解析をして、ゲノム・エピゲノム・トランスクリプトーム…

ぱらぱらめくる『The Human Cell Atlas White Paper』

Human Cell Atlas プロジェクト Human Cell Atlas White Paper SUMMARY 目的と現時点の解釈 ヒトの全細胞に関するレファレンスマップを作成し、生命現象、疾患の診断・モニタリング・治療に関する理解を深めるとともに、遺伝的多様性に紐づく表現型多様性(特…

Maximum Mean DIscrepancy その3

Rのkernlab library(kernlab) # create data x <- matrix(runif(300),100) y <- matrix(runif(300)+1,100) mmdo <- kmmd(x, y) mmdo > mmdo Kernel Maximum Mean Discrepancy object of class "kmmd" Gaussian Radial Basis kernel function. Hyperparameter…

フーリエ、巻きつける

分布関数があったときに、としてやるとモーメント母関数。が実数tに関して無限の広がりを持つので、無限に複雑な分布関数の情報を担わせることができる ちょっと変える。。これは特性関数。複素数を導入することで、無限遠まで伸びる実数直線を単位円周に「…

ぱらぱらめくる『カーネル法入門』

カーネル法入門―正定値カーネルによるデータ解析 (シリーズ 多変量データの統計科学)作者: 福水健次出版社/メーカー: 朝倉書店発売日: 2010/11/01メディア: 単行本 クリック: 19回この商品を含むブログ (11件) を見る 章末にまとめが書いてある。それをかい…

特性関数・指数型分布族・情報幾何

メモ的なRmdファイル --- title: "特性関数・指数型分布族・情報幾何" author: "ryamada" date: "2018年1月18日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)…

カーネル法?KL divergence?

メモ的なRmdファイル --- title: "カーネル法?KL divergence?" author: "ryamada" date: "2018年1月17日" output: html_document: toc: true toc_depth: 6 number_section: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` …

確率密度関数同士の内積

標本から確率変数の分布を推定することがある パラメトリックな推定では分布の型を決め、その型を表すパラメタの最尤推定などを行って特定の分布であると推定する ノンパラメトリックな推定の一つにカーネル法がある。あるローカルな確率密度は、その知りた…

特性関数

確率密度分布があったときに、特性関数というものがある 分布を一意に確定するものとして密度分布があるが、それの双対になっている特性関数も分布を一意に決めるよ、という話 確率変数 X があったときに、を特性関数と言うよ、とのこと このはのこと これは…

メモ

確率密度関数⇔特性関数 (フーリエ変換、双対、) キュムラント母関数は、2つの定義(こちら) 積率母関数の自然対数 特性関数の自然対数 いずれも、確率変数のモーメントを保持している 指数型分布族の場合、log-partition 関数(正規化項に対する関数,)は、キ…

特性関数

確率変数Xがあるという。たとえば正規分布に従う変数。 確率密度関数が書けたりする 今、Xと関係する別の確率変数Yを考える ただし、Yは 複素数である 実数変数tによって変わるものとする 実際と定める この複素確率変数には「平均〜期待値」がある この期待…

kernlab パッケージ

カーネル法の代表格がサポートベクターマシン サポートベクターマシンの実装はC/C++,MATLABにもあり、Rでもe1071にそのカウンターパートがある サポートベクターマシン以外にもカーネル法の使い道はある カーネル法一般利用をするための諸関数を提供するのが…

MMDでマイクロアレイ発現解析

MMD

Integrating structured biological data by Kernel Maximum Mean Discrepancy

MMDでChIP seq解析

MMDiff2パッケージ source("https://bioconductor.org/biocLite.R") biocLite("MMDiff2") library('MMDiff2') library('MMDiffBamSubset') ExperimentData <- list(genome='BSgenome.Mmusculus.UCSC.mm9', dataDir=system.file("extdata", package="MMDiffBa…

カーネル平均を用いた統計的推論

統計的推論は確率Pに関する推論問題だが、それと1対1対応するRKHSの関数(ベクトル)であるカーネル平均に関する推論問題とみなせる 2標本問題であれば、2つのカーネル平均が同じか否かと言う問題になる 独立性検定であれば、同時分布のカーネル平均が、個…

カーネル平均

カーネル関数 を定めると、それに対応して、このカーネル関数を内積とする関数のヒルベルト空間が定まる の集合から、このヒルベルト空間(の関数)への写像があるわけであるが、このに対応する関数をと書いたりと書いたりする 今、確率変数がの集合(空間)にあ…

カーネル法

カーネル法は、一般化した定義があるが、一般化した話をするとイメージが湧かないので、具体例に即して書いて、そこに(可能な範囲で)一般化したときにどういうことかということを書き添えることにする 正定値カーネル関数(Wiki) カーネル関数というのがある…

Maximum Mean Discrepancy

こちらの資料は「カーネル法入門」のうちの「カーネル平均を用いたノンパラメトリック推論」と題されたPDF そのなかにMaximum Mean Discrepancyの定義が出て来るらしい 確率変数(の観測標本)があるときに、そこにノンパラに分布推定をするつもりながら、分布…

ぱらぱらめくる『Nature Reviews Genetics』2017

Dec 2017 Genome editing から Genome writing Nov 2017 発生・分化とepigenetic marks Oct 2017 検出されるバリアントの重要度順位付け(メンデリアン遺伝) Sep 2017 ネットワーク解析の諸手法の基礎であるネットワーク・プロパゲーション Aug 2017 Chromati…

U統計量

あっているかどうか、心もとないメモ Unbiased な統計量の総称的な位置づけとして"U-statistic"と言う用語がある 昨日の記事で書いたMVUB estimatorの考え方と大きく関係する " In probability theory, a measurable function on a probability space is kno…

Minimum-variance unbiased estimator

Wiki記事(英語)を抄訳・意訳しておく パラメタで表される確率分布があるとする。そのはなるパラメタの広がりを持つとする。 そこからのiid標本がえられ他と気に、それを使って、の関数となる何か(の値を推定したいとする。 何かを推定するときに、どんなに頑…

FDR

FDR

日本語総説 m <- 100 u <- 50 v <- m-u n1 <- 100 n2 <- 100 my.means <- function(m,u,M,S){ m1 <- rep(0,m) m2 <- c(rep(0,m-u),rnorm(u,M,S)) return(cbind(m1,m2)) } M <- 0.1 S <- 1 ms <- my.means(m,u,M,S) my.X <- function(m,u,M,S,n1,n2){ ms <- m…

log sum exp

メモ 指数関数を使うと値が小さくなりすぎるものの足し合わせの際に、複数の値の相対値がそれほど小さくならないことを利用して、計算の精度を担保する方法 f <- function(a,b){ #log(exp(a)+exp(b)) b + log(exp(a-b)+1) } g <- function(as){ if(length(as…

Mendelian Randomization

以前、こんな風にまとめた 別の書き方をしてみる 簡単に書き直すと、YにXが影響を与えているのだが、それは隠れた因子UがXとYに影響を与えているからかもしれないので、Uに関係なくXがYに影響を与えているかを知りたい。しかしながらUはどんなものがあるのか…

線形判別分析 LDA

複数のクラスがあって、それぞれのクラスの標本について、複数の変数が観察されている 「中心からのずれ」を定量する 定量にあたって 全体が1つの集団とみなし、全標本の全体の重心からのずれを定量する((SSall) クラスごとに1つの集団とみなし、クラスの…

多項観測ベクトルの異同

(たとえば)スキンフローラを観測して、2サンプル間でその異同を数値にしたいとする Bray Curtis法というのがある。0-1におさまる こちら こちらの論文で使っている

ぱらぱらめくる『Information Geometry and Population Genetics』

Information Geometry and Population Genetics: The Mathematical Structure of the Wright-Fisher Model (Understanding Complex Systems)作者: Julian Hofrichter,Juergen Jost,Tat Dat Tran出版社/メーカー: Springer発売日: 2017/03/06メディア: ハード…

ぱらぱらめくる『言葉と物ー人文科学の考古学ー』

言葉と物―人文科学の考古学作者: ミシェル・フーコー,Michel Foucault,渡辺一民,佐々木明出版社/メーカー: 新潮社発売日: 1974/06/07メディア: 単行本購入: 5人 クリック: 55回この商品を含むブログ (174件) を見る まずはあとがきから キリスト教・マルクス…

L1ノルムで中央値、L2ノルムで平均値

標本平均値は、標本の値の和を標本の数で割ることでえらる それは、標本から推定された期待値 それは、L2ノルムの和を最小にするような値 標本の中央値は、ソートして真ん中に来る値 それは、L1ノルムの和を最小にするような値 こちらも参考 x <- c(rnorm(10…

7 The Planar Shape Space ぱらぱらめくる『Nonparametric Inference on Manifolds: With Applications to Shape Spaces』

Direct Similarity Shape Spacesの中での場合 平面上の形の解析は形解析の基本であり、需要も多いので、取り立てる 二次元平面上の点を複素平面上の点とみなす 複素数重心で標準化すると、重心を中心としたk次元複素ベクトルが形に対応する これを倍すること…