オミックス
ウェット系の人とオミックス解析について考えるためのメモ(ドラフトpreziスライド(2015/07/14 生命科学研究科特論2コマ) 用)
記事の目次・リストはこちら New dimensions in immunology heterogeneity and randomnessとを捉えることが免疫系の理解 heterogeneity and randomnessを扱うための実験技術・データ解析技術の登場・進歩 個別細胞解析を許す諸技術(Deep seqence、然り) hete…
ひとまず、次世代データ、Deep sequencing データの資料はこんなもの 「こうすれば、よい」という段階ではないので、コンセプト説明が重くなり、また、いざというときの汎用性重視になった…結局、「入門」としては役に立てにくいのだが… まだ、1度も講義使用…
こちらの続き SNPのケースコントロール分割表のための配布資料 これで90分1回分か2回分と予想 以下はRmdフォーマット。knitrするとhtml化、epub化できます(もちろんフリー)→こちら) その手間を惜しむ人向けにKindleサイトを利用中(こちらにほどなく現れる予…
京都大学大学院医学研究科の修士対象講義は、2012年度に「インフォマティクス」2013年度に「統計学処理の基礎概念」を扱っています。2014年度は、遺伝疫学やオミックスデータ解析の論文の主張を読み取ったり、それを臨床展開することを念頭に置いた「解析初…
ゲノム 染色体単位の塩基配列 染色体配列: ハプロイド: ディプロイド:ただし、ここで父由来・母由来を区別しているが、区別しないで丸めることも多い 遺伝子単位の塩基配列(ただし、ここでの遺伝子の定義は、DNA配列であって、ゲノム上の特定の連続する範…
GWASでほとんど成果の上がっていない病的過程について考える その病的過程はエンティティとしての疾患の一部という意味で「サブ・最終フェノタイプ」 その「サブ・最終フェノタイプ」は最終フェノタイプとしての疾患x複数に共有されている このようなサブ・…
毎年、秋にジュニアキャンパスと言うのがある@京大(こちら) 2013年度はどうする?(こちらで内容を適宜アップデート(予定)) パーソナライズド・メディシンの基礎となるかもしれない、「確率的な情報提供」のfeasibilityを中学生と考えてみる? 診断結果・治…
こちらの論文(Personal Omics Profiling Reveals Dynamic Molecular and Medical Phenotypes ) データ解析に関しては、Experimental ProceduresのExtended タブ(こちら) 以下、その手順 データを収集 時系列で データのタイプ Whole Genome Seq. Whole Exom …
マルチオミックスプロジェクト 関連記事はこちら マルチオミックス解析に関して、Exploratory Analysis of Multiple Omics Datasets Using the Adjusted RV Coefficient (Statistical applications in genetics and molecular biology 10(1) 2011 こちらのイ…
A(ゲノム・トランスクリプトーム・プロテオーム・メタボロームに関する、レファレンスへのリンク付きの短い概説) Omics Gateway B(Clinical Proteomic Technologies for Cancer Initiative) (1)"The hypothesis [of the clinical arm] is that the genome-d…
実験技術の大規模化が進み、ハイスループットデータというものがそこらじゅうにある ハイスループットデータは、データ量が多いだけに、小さなバイアスが「確定的な結論」をミスリーディングする可能性が高い おのずと、データのクオリティコントロールが重…
ゲノムやオミックス・バイオマーカーなどを用いた経時的情報収集・疫学の遂行のための専門員が学ぶことになるだろう内容・範囲は何かと考えた 思いつくままに挙げてみる ▲は自分が教えたり資料を作ったりしたことが「ゼロではない」内容 ■は大学・大学院で正…
ゲノム・オミックス領域のデータマイニング・データ解析と、いわゆる統計解析の(従来型)本流との関係を説明した文書とか、あまりないのですが、日本計量生物学会の最新号の総説が、 『ゲノム・プロテオミクスデータを用いた予測解析:機械学習による新しい統…
公共データ(オミックス系)で、お試しデータセットを探している Bioproject(こちら) その使い方動画サイト(こちら) Rのdatasets パッケージの中は help(package="datasets") Rのパッケージfarawayはオミックスではないけれども、多彩なデータセット
オミックスデータの解析の調べもの(こちら)をしていたらMAQC Consortium関係でTox21(こちら)というプロジェクトの資料を見ることになった 資料は"Review of the Biomolecular Screening Branch by the NTP Board of Scientific Counselors"(こちら) NTP Visi…
大きく2戦略 標的なし・標的あり データ加工 Low-level processing 実験プラットフォーム等により定型化・自動化 Mid-level processing 圧縮 標準化(1実験内で、実験間で、比較可能にする) 定量 内部標準を用いた相対化 定量限界の設定 外部解析リソースの…
Omicsデータの解析手法を概説しているBioinformatics for Omics Data Methods in Molecular Biology, 2011, Volume 719, Part 1, 113-131, DOI: 10.1007/978-1-61779-027-0_5(こちら)を眺める 発現解析を主なターゲットにしている イントロ オミックスデータ…
成分数として「適当な値」を見つけないといけない Leave-one-outなどを用いて、「これ」という値を見つけることになる それについては、こちらなど
昨日の続き PLSモデルはパッケージparcorでも lasso, adaptive lasso, PLS, and Ridge Regression, model selection for lasso, adaptive lasso and Ridge regression based on cross-validation. 重回帰→主成分回帰→PLSRという展開 重回帰 主成分回帰 ここ…
重回帰と式の具合を比べてみよう 重回帰 主成分回帰 この式の比較から、重回帰でのと、主成分回帰でのとに違いが集約されていることがわかる
plsパッケージのpcr()関数の出力と前の記事の出力の対応を調べる pcr.out<-pcr(Y~X) # 出力の中身を確認する str(pcr.out) # 係数行列(主成分の数ごと) #pcr.out$coefficients = pcr.out[[1]] for(i in 1:maxa)print(Bs[[i]]-pcr.out$coefficients[,,i]) # …
昨日の続き Rのplsパッケージのpcr()関数(PCR処理)の出力が今一つわからなかったので特異値分解との関係を確認する 行列式関係 特異値分解 ,( 主成分回帰では、「主な」成分のみを使うので、それを取り出すことを考える 使用する主成分の数をとすると、上記…
2011/08/12,2011/08/13の記事に書き直したので、そちらの方がわかりやすいです。
重回帰 Multiple Linear Regression # 重回帰 multiple linear regression n<-6 m<-4 X<-matrix(runif(n*m),n,m) m2<-2 Y<-matrix(runif(n*m2),n,m2) B<-solve(t(X)%*%X)%*%t(X)%*%Y Y-X%*%B # n
chemometrics(計量化学)という分野があるという(日本語版Wiki、英語版Wiki) 『大量のデータに対し、次元の圧縮・視覚化・回帰・判別・分類などを行うことによって、より構造的に理解しやすい形に加工し、実験結果の解釈に重要な情報を提供することを目的とす…