2015-04-01から1ヶ月間の記事一覧

生命科学インフォマティクスに求められる標準スキル

ゲノムインフォマティクスに関する調べものをしていて、おもしろい資料に行き当たった その名も「Life Science Infromatics Skill Standards」(こちら) かなりな量になるが、抜き出して行こうと思う(まだ、書きかけです) 文書構成 概観 ライフサイエンス(LS)…

ゲノムインフォマティクスとは、を説明するための資料リンク

Informatics総論 science, technology, engineering and mathematics (STEM) Bioinformatics(Wiki) Life Science Informatics Skill Standards NIH genome-informatics Program The Importance of an Integrated Informatics Solution for Life Science Orga…

Gene Set Enrichment Analysis

Evaluating Gene Set Enrichment Analysis Via a Hybrid Data Model (元ネタ論文) 基本 マイクロアレイデータで、遺伝子発現の差があるかどうかを見る すべての遺伝子を個別に調べるとマルチプルテスティングで希釈されて見えなくなるので、遺伝子をセットに…

SeqGSEA

パッケージに関する記事サイト そこからの引用 The package generally provides methods for gene set enrichment analysis of high-throughput RNA-Seq data by integrating differential expression and splicing. It uses negative binomial distribution…

ぱらぱらめくる『Stochastic Models, Information Theory, and Lie Groups』

この本は最終的には、確率・統計・解析に関することにつながるようだが、難所の多くが幾何・多様体・微積・ベクトル解析などになりそうなので、こちらのブルーブログに書いておくことにする。 Stochastic Models, Information Theory, and Lie Groups, Volum…

カーネル どこでまとまるのか

昨日の記事で、カーネルPCAを含むPCAの色々について書いた この『カーネル』という単語がクセモノで、わかりにくい Wikipediaのカーネルの曖昧さ回避の日本語ページ(こちらは大したこともないし、数学・統計関係も統計・学習で用いるカーネル関数と、線形空…

PCAとその発展(カーネルPCA、欠測値対応、latent variable-PCA,GP-LVM)

参考 Rmdで書いてみる PCAとその周辺のために、Rのパッケージkernlab,pcaMethods,dmtを使って、処理をなぞってみる 基本的には固有値分解という、よいライブラリが準備されていて解釈も簡単な線形代数計算に帰着させよう、という手法で、一番基本的ないわゆ…

PCAとその発展(カーネルPCA、欠測値対応、latent variable-PCA,GP-LV

PCAとサポートベクターマシン

サポートベクターマシンはマシンラーニングの基本 Matlabとか数値計算系で実装が先行していて、Rでは追随、という形 パッケージe1071が先行のlibsvmとかを実装しているそうだ kernlabっていうのものサポートベクターマシンの基本的な手法をサポートすること…

PCAと欠測値ありのPCA

PCAは少ない軸で高次元データを説明する手法(べたにやるならこちらとか) 欠測値がないことを前提にして作られている じゃあ欠測値があるときには、というと、足りないところを埋めながらPCAすることになる。埋めてからPCAする、というのもありだが、PCAしな…