2018-01-01から1年間の記事一覧

パラパラめくる『Nature Reviews Genetics』2018

12月号 マウスのシングルセルアトラス的解析(100000細胞の1細胞トランスクリプトーム),tSNE 実験介入して癌のQuantitative biology解析、かつ、ヘテロな細胞構成としての癌 3Dゲノム構造 11月号 RNA velocity method ("RNA velocity that leverages nascent …

Cross-Validation 実習

医療経済分析

Rに個人の時系列変化を追いかけて治療法(治療薬)の経済性を解析するパッケージ hesim がある。そのVignette(こちら)のコードをなぞってみる。オリジナルサイトのコードだとエラーが出るので、ちょっと修正してある

ヒートマップの解剖

PCAの練習

パワー計算の実習

ランダム家系データ作成

数式練習

数式を画像ファイルとしてコピーペーストするための砂場 V=\begin{pmatrix}v1\\v2\\...\\vn \end{pmatrix} V^T=(v1,v2,...,vn) \begin{pmatrix} V1\\V2\\ ... \\ Vn \end{pmatrix} \begin{pmatrix} V1, V2,...,Vn \end{pmatrix} = \begin{pmatrix} V1^TV1, V…

対立仮説の下でのSNP table

t-SNEのt-分布

次元削減の1手法のtSNE 高次元の標本間の遠近情報を ある点を中心として別の点が観察される確率として評価する その確率を、観測標本全体で重み付き標準化する さらに、その標準化確率行列が非対称なので対称化する 低次元に埋め込むとき 全く同様に低次元…

デンドログラムを二次元平面の上に描く

二次元平面上に標本があり、それらの間に階層的クラスタリング構造が得られたとする 二次元平面上に標本を配置しつつ、その平面から立ち上がるようにデンドログラムを描きたいかもしれない library(FactoMineR) # Compute PCA with ncp = 3 res.pca <- PCA(U…

球面調和関数係数も一般化逆行列で推定

球面に場があったとする それを球面調和関数で分解する 球面調和関数は直交基底関数なので、個々の関数が場を説明する成分を積分して計算してもよいが、SPHARMというツール(こちら)では、一般化逆行列を使っている(この論文のメソッドセクション) どういうこ…

HWE検定の自由度1を確かめる

帰無仮説から3ジェノタイプカウントを生成して、カイ二乗値をランダム生成して、カイ二乗分布との一致を確認してみる gist.github.com

ノンパラメトリック・ベイズ実践編2 回帰

まず、単純に線形回帰 s <- rnorm(n,0,1) head(s) m <- matrix(s,ncol=2) head(m) lm_res <- lm(m[,2] ~ m[,1]) lm_res plot(m) abline(lm_res) pythonで行こう Scikit learn の gaussian process regression そのExamplesの一つ カーネル関数から、値のsimi…

ノンパラメトリック・ベイズ実践編

Non-parametric bayesian clustering Data set simulation n <- 1000 d <- 4 k <- 5 s <- sample(1:k,n,replace=TRUE) m <- matrix(rnorm(d*k,sd=6),k,d) X <- matrix(0,n,d) for(i in 1:k){ tmp <- which(s == i) r <- matrix(rnorm(d * length(tmp))) X[tm…

インフォグラフィックとデータ視覚化

[データ視覚化][インフォグラフィック] データ視覚化とインフォグラフィック。 統計学・データサイエンスの分野では、データを解りやすく伝える技術としてデータ視覚化(data visualization)もあります 両者には似ている点もありますが、異なる点もあります。…

引越しました

2018/09/04に引っ越しました。 引越し後(はてなブログ) 引越し前(はてなダイアリー)

ノンパラ・ベイズ 夏休み集中セミナーメモ

9月1日 パラとノンパラの基礎概念 資料1『Parametric vs Nonparametric Models』 パラは有限個パラメタ、ノンパラは無限個パラメタのモデル 無限個パラメタのモデルとはどういうことかをわかることが大事 ノンパラベイズは無限個パラメタを想定しつつ、実…

ノンパラ・ベイズ 夏休み集中セミナーメモ0

予定 9月1日(パラとノンパラの基礎概念。ノンパラ検定) 9月17日(ノンパラ・ベイズの短いチュートリアル) 9月22日(長文資料のつまみ食い。R・パイソンで遊ぶ、その1) 9月24日(長文資料のつまみ食い。R・パイソンで遊ぶ、その2) 参加者 A(統計遺…

6 General Posterior Distribution 一般化した場合 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Algebraic geometric transformにより、standard form(5章の形)に持ち込めることを示す となれば、5章で示したStandard formの色々な良い性質がそのまま使える(らしい)

5 Standard Posterior Distribution 事後分布が正規分布の場合 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

モデルが真の分布を含み、推定にあたり、漸近的に正規分布を想定できる場合は簡単。ベイズ推定と最尤推定とがほぼ一致するから 真の分布は正規分布とはみなせないことも多く、その場合は、ベイズ推定のあてはまりがよくなる と一般化できる(そうだ) この章で…

3 Basic Formula of Bayesian Observables 観測量のベイズにおける基礎的な式 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

(1) 真の分布と統計モデルの関係の定義をする (2) 観測変数のベイズ流定義とのそのnormalized version (3) ベイズ予測のキュムラント母関数の定義 (4) ベイズ統計の基礎的な理論事項をキュムラント母関数を用いて証明する(それにより、真の分布とモデルと予…

1 ベイズ統計の基礎 ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

真の分布の事前分布があって、それぞれがある観測をもたらす確率がわかっていれば、観測から真の分布の事後分布が計算できる、というのがベイズの定理 残念ながら、事前分布も正確には解らないし、観測をもたらす確率も解っていない(のでモデルを入れる)から…

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

ぱらぱらめくる『Mathematical Theory of Bayesian Statistics』

Mathematical Theory of Bayesian Statistics (Chapman & Hall/Crc Monographs on Statistics & Applied Probability)作者: Sumio Watanabe出版社/メーカー: Chapman and Hall/CRC発売日: 2018/04/19メディア: ハードカバーこの商品を含むブログ (2件) を見…

固有値分解する

の最小化 の最小化 Mの最小固有値に対応する固有ベクトルが一番拡大率が小さいから、その固有ベクトル方向のが求める解 n <- 100 X <- matrix(rnorm(n*2),ncol=2) Y <- X %*% c(1,2) + rnorm(n,0,0.01) library(rgl) plot3d(X[,1],X[,2],Y) lm(Y ~ X-1) XY <…

メモ

ごちゃごちゃと考えたときのメモ 普通のポアソン分布は非負整数を台としてその上に非負実数を配するルールをパラメタ依存に定める。そういう意味で、パラメトリックな確率分布とは、「ある台」に総和(全体の積分)が1になるような確率質量・密度を定めるルー…

ぱらぱらめくる『The Ubiquitous Ewens Sampling Formula』

ペイパーはこちら Ewens sampling formulaは遺伝統計学分野から出た正確確率計算式で、ある理想集団におけるアレル頻度パターンが生じる確率の式であるが、それは離散確率過程において応用範囲が広いものであり、遺伝学・生物学の中では、アレル頻度だけでな…

ポアソン点過程・分割・ノンパラメトリックベイズ

動機 色々動機はあるかもしれないが 多数のもの・無限個あるかもしれないもののタイプ分けが興味の対象 クラスタ数不定な状況でのクラスタリング そのための確率モデル その確率モデルの下での生起確率・事前確率・尤度・事後確率 モデル 具体的な説明から始…

Ewens sampling formula

Ewens sampling formulaは、集団のハプロタイプ生成状況にある条件を課したときに、標本の頻度分布の正確確率に関する式 これは集団遺伝学の領域では、最も単純な条件でのCoalescent過程が生成する頻度分布になる Coalescent過程は頻度分布のみを定めるだけ…