2011-08-01から1ヶ月間の記事一覧

ちょっとメモ

# ケースとコントロールの人数 Nca<-Nco<-1000 # ケースコントロール別のレアアレル保有者数 nca<-20 nco<-0 # 計算するための、ケース・コントロールのアレル頻度(パラメタとして振ってある) dp<-0.001 pca<-seq(from=dp,to=0.05,length=100) pco<-pca # 確…

レアバリアント 単マーカー検定のメモ

『ゲノム・プロテオミクスデータを用いた予測解析:機械学習による新しい統計的手法』

ゲノム・オミックス領域のデータマイニング・データ解析と、いわゆる統計解析の(従来型)本流との関係を説明した文書とか、あまりないのですが、日本計量生物学会の最新号の総説が、 『ゲノム・プロテオミクスデータを用いた予測解析:機械学習による新しい統…

公共データ

公共データ(オミックス系)で、お試しデータセットを探している Bioproject(こちら) その使い方動画サイト(こちら) Rのdatasets パッケージの中は help(package="datasets") Rのパッケージfarawayはオミックスではないけれども、多彩なデータセット

{R][マイクロアレイ][Gene Expression Omnibus]GEOquery

遺伝子発現データの公共サイトGEO(http://www.ncbi.nlm.nih.gov/geo/Home - GEO - NCBI) それをRに読み込むためのパッケージ(やら仕組み) 説明サイト(こちら) コマンド source("http://www.bioconductor.org/biocLite.R") biocLite("GEOquery") library(Biob…

ぱらぱらめくる『Algebraic Geometry and Statistical Learning Theory』

こちらから続く Algebraic Geometry and Statistical Learning Theory (Cambridge Monographs on Applied and Computational Mathematics)作者: Sumio Watanabe出版社/メーカー: Cambridge University Press発売日: 2009/08/13メディア: ハードカバー クリッ…

医学部での確率と尤度の周辺

思いつくままに、挙げてみる(そして、「確率・尤度・統計・推測」という縦軸で『カリキュラムを再構成』するとしたら、どうなるかを考える カリキュラムの組み方の難しさはすでに年来の課題 たとえば、以下の2択 基礎(解剖・生理・生化・薬理・病理)→臨床 …

ぱらぱらめくる『Lectures on Algebrainc Statistics』

こちらから続く Lectures on Algebraic Statistics (Oberwolfach Seminars)作者: Mathias Drton,Bernd Sturmfels,Seth Sullivant出版社/メーカー: Birkhauser Basel発売日: 2008/12/10メディア: ペーパーバック クリック: 18回この商品を含むブログ (2件) を…

ぱらぱらめくる『計算統計入門・代数生物学』

こちらから 計算統計入門 代数生物学―大規模・高精度計算が拓いた新技法 (現代技術への数学入門)作者: 吉田寛,手塚集,若山正人出版社/メーカー: 講談社発売日: 2008/06/13メディア: 単行本購入: 5人 クリック: 44回この商品を含むブログ (3件) を見る 第0章…

代数統計学 algebraic statistics

代数統計学という分野があるそうだ こちらで次のように書かれている 「近年の統計学の発展はめざましい. その原動力は計算機の性能の大幅かつ急速な進歩である. それによって統計学の方法は一新され, 適用範囲も広がった. 一方, 大量の計算が必要なため, か…

LD50、エームス試験 他

毒性評価の一般知識(資料1、資料2、資料3) 医薬品の遺伝毒性試験(資料) "CRAN, LD50"の検索でひっかかるパッケージ doBy パッケージのdose.LD50() データを回帰して回帰曲線式から算出 install.packages("doBy") data(budworm) m1 <- glm(ndead/20 ~ sex …

毒性試験・変異原性試験

トキシコローム?

オミックスデータの解析の調べもの(こちら)をしていたらMAQC Consortium関係でTox21(こちら)というプロジェクトの資料を見ることになった 資料は"Review of the Biomolecular Screening Branch by the NTP Board of Scientific Counselors"(こちら) NTP Visi…

マス-スペクトロメトリーを使った実験(メタボローム)

大きく2戦略 標的なし・標的あり データ加工 Low-level processing 実験プラットフォーム等により定型化・自動化 Mid-level processing 圧縮 標準化(1実験内で、実験間で、比較可能にする) 定量 内部標準を用いた相対化 定量限界の設定 外部解析リソースの…

Omicsデータの解析手法の概説(トランスクリプトーム)(初めてのヒトのチェック事項)

Omicsデータの解析手法を概説しているBioinformatics for Omics Data Methods in Molecular Biology, 2011, Volume 719, Part 1, 113-131, DOI: 10.1007/978-1-61779-027-0_5(こちら)を眺める 発現解析を主なターゲットにしている イントロ オミックスデータ…

PLSR Partial Least Square Regression 2

成分数として「適当な値」を見つけないといけない Leave-one-outなどを用いて、「これ」という値を見つけることになる それについては、こちらなど

PLSR Partial Least Square Regression

昨日の続き PLSモデルはパッケージparcorでも lasso, adaptive lasso, PLS, and Ridge Regression, model selection for lasso, adaptive lasso and Ridge regression based on cross-validation. 重回帰→主成分回帰→PLSRという展開 重回帰 主成分回帰 ここ…

主成分回帰 Principal Component Regression (PCR)3

重回帰と式の具合を比べてみよう 重回帰 主成分回帰 この式の比較から、重回帰でのと、主成分回帰でのとに違いが集約されていることがわかる

主成分回帰 Principal Component Regression (PCR)2

plsパッケージのpcr()関数の出力と前の記事の出力の対応を調べる pcr.out<-pcr(Y~X) # 出力の中身を確認する str(pcr.out) # 係数行列(主成分の数ごと) #pcr.out$coefficients = pcr.out[[1]] for(i in 1:maxa)print(Bs[[i]]-pcr.out$coefficients[,,i]) # …

主成分回帰 Principal Component Regression (PCR)

昨日の続き Rのplsパッケージのpcr()関数(PCR処理)の出力が今一つわからなかったので特異値分解との関係を確認する 行列式関係 特異値分解 ,( 主成分回帰では、「主な」成分のみを使うので、それを取り出すことを考える 使用する主成分の数をとすると、上記…

PLS Partial Least Squares/Projection to Latent Structuresの整理記事

2011/08/12,2011/08/13の記事に書き直したので、そちらの方がわかりやすいです。

PCR(Principal Component Regression)とPLSR(Partial Least Squares Regression

重回帰 Multiple Linear Regression # 重回帰 multiple linear regression n<-6 m<-4 X<-matrix(runif(n*m),n,m) m2<-2 Y<-matrix(runif(n*m2),n,m2) B<-solve(t(X)%*%X)%*%t(X)%*%Y Y-X%*%B # n

PLS Partial Least Squares/Projection to Latent Structures

chemometrics(計量化学)という分野があるという(日本語版Wiki、英語版Wiki) 『大量のデータに対し、次元の圧縮・視覚化・回帰・判別・分類などを行うことによって、より構造的に理解しやすい形に加工し、実験結果の解釈に重要な情報を提供することを目的とす…

ガスクロマトグラフィー・マススペクトロメトリーでメタボローム

物質・分子を分離・精製する方法にクロマトグラフィーがある その一つがガスクロマトグラフィー 絵付きの説明などはこちら 揮発性物質の分離・精製をする 適用範囲が広い 微量成分を一度にできる 観測するもの 「保持時間(Retention Time: RT)」 そのピーク…

順序なしカテゴリカルデータをvglm()で

R

前のデータで順序なしカテゴリであるx4を被説明変数にしてy.2を順序ありカテゴリの説明変数にする # 最終形質が順序なしカテゴリの場合 # 順序なしカテゴリ x4を被説明変数にしてやる fat.out0 <- vgam(x4 ~ 1,family = cumulative(parallel = TRUE, reverse…

順序ありカテゴリカルデータをvglm()で

R

本日の1つ前の記事の続き データを適当に作ってvglm()にかけてみる # VGAMを使ってみよう # 最終形質が順序ありカテゴリの場合 # y 量的形質 # y.2が直接観測できずに、順序ありカテゴリ値が得られる # たとえば {0,1,2,3} 重症度分類 # 説明変数が複数ある …

VGAMパッケージで(順序つき)カテゴリ

R

こちらからの続き カテゴリカルデータの処理はごちゃごちゃしている カテゴリカルデータについて「総まとめ」してくれそうなのはVGAMパッケージの『VGAMをカテゴリカルデータに使うための解説文書』で→こちら VGAMパッケージ全般に関するPDFはこちら その解…

順序カテゴリで重回帰

R GEE

こんな処理も データ例 > Orthodont Grouped Data: distance ~ age | Subject distance age Subject Sex Male 1 26.0 8 M01 Male 1 2 25.0 10 M01 Male 1 3 29.0 12 M01 Male 1 4 31.0 14 M01 Male 1 5 21.5 8 M02 Male 1 6 22.5 10 M02 Male 1 7 23.0 12 M0…

学士力

統計学分野の教育課程編成上の参照基準というのがあるそうだ 臨床医学なら医学・薬学分野(こちら)が相当するだろう 基礎医学なら・・・と思ったが、「数理科学分野(こちら)」は、「生命基礎科学」向けではなく、かといって、「医学・薬学分野」で実験関係の…

駆け足で読む『入門 実験計画法』

入門 実験計画法作者: 永田靖出版社/メーカー: 日科技連出版社発売日: 2000/06/01メディア: 単行本購入: 8人 クリック: 160回この商品を含むブログ (4件) を見る 統計の学習は、「こんな統計手法でやってみよう」という本が多いけれども: 検定とは何か、推…