RESTRICTED LEAST-SQUARES REGRESSION

回帰

メモリンクメモ２

2014-01-26

Isotonic Regressionと半順序

Isotonic Regression 半順序グラフ R quadprog igraph

n次元空間に点が散在しているとするこの点にはスカラー値が観察されているこのスカラー値は、n次元空間に面をなすスカラー値の分布の観察値である観測点における、スカラー値の大小関係がわかっているものがあるときに、その大小関係制約を入れて、推定値…

2014-01-25

ぱらぱらめくる『high_dimensional_immune_analysis』

ぱらぱらめくるシリーズオミックス高次元免疫

記事の目次・リストはこちら New dimensions in immunology heterogeneity and randomnessとを捉えることが免疫系の理解 heterogeneity and randomnessを扱うための実験技術・データ解析技術の登場・進歩個別細胞解析を許す諸技術(Deep seqence、然り) hete…

2014-01-24

センター試験と二次試験の間

事後確率

週末にセンター試験があり、二次試験への出願を考える季節です。2段階方式の総合点での合否判定を絵で描いてみます。第１段階の情報が得られた時点での、事後確率の計算です。少しずつ情報を仕入れて、それに基づいて、先を予測するのは、医療現場での頭の…

2014-01-24

二段階の試験の途中にいる、今

2014-01-23

診断尤度比、ROC、ロジスティック回帰

ROC 診断尤度比ロジスティック回帰 R

２群の値分布が正規分布に従い、その正規分布の分散が等しい場合。２群は黒群が少なめ左上の図は、２群の確率密度分布。カーブ下面積は、群の比率になる中上の図は、値ごとに２群の比率考慮の確率密度から、赤・黒それぞれの相対確率(相対尤度)を計算して…

2014-01-23

診断尤度比、ROC、ロジスティック回帰

2014-01-22

たくさんであることを利用する(HWE・集団構造化・FDR)〜オミックス統計学入門2014

R

集団構造化・民族差・ＨＷＥはゲノム疫学データの読み取りに必要になる知識だが、オッズ比の解釈等とはちょっと違って、論文を読む限り、査読の段階できちんとやっていてくれれば、読者はスルーしても(おおまかには)大丈夫それとは違って大量に対立仮説＝真…

2014-01-21

次世代シークエンサーを使ったデータ解析〜オミックス統計学入門2014

R 教科書オミックス次世代シークエンサー

ひとまず、次世代データ、Deep sequencing データの資料はこんなもの「こうすれば、よい」という段階ではないので、コンセプト説明が重くなり、また、いざというときの汎用性重視になった…結局、「入門」としては役に立てにくいのだが… まだ、1度も講義使用…

2014-01-21

次世代シークエンシングの基礎　オミックス統計学入門2014

2014-01-19

次世代シークエンサーを使ったデータ解析〜オミックス統計学入門2014

これは下書き！→こちらが本記事次世代の扱いは、その確率的データハンドリングについての基礎をやるまずは、シークエンスしてバリアントを検出する流れをみるその後で、シークエンシングデータの「確率的」側面をやるそれを扱うのに大きく２つの流れ既…

2014-01-18

13. cDNA LigationとMassive Parallel SequencingでReverse Transcriptase Termination Sitesを見つける：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

パス

2014-01-18

12. ChIP-seqデータの統計解析(MOSAiCSで)：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

ChIP-SeqにはChIP-Seqのデータハンドリング・ＱＣのやり方があって、それをbioconductorのmosaicパッケージでやる話

2014-01-18

11. ChIP-seqで転写因子結合部位を検出する。その方法の最適化：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

ツール紹介 PeakSeq,MACS,FindPeaks,QuEST,CSAR ツールの実行は実行条件設定を伴い、結果が変わる条件設定値をどうやって選ぶか、その最適化に関する話

2014-01-18

10. RNA SequencingでAlternative Splicing の起き方を調べる：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

基本的には、出てきたリードをマップし、そこからAlternative splicingのパターン検出と定量法・差の検定(ＦＤＲ）の１提案

2014-01-18

9. Deep SequencingでmiRNAのRNA editing sitesを見つける：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

パス

2014-01-18

8. 疾患バリアントの検出のためのエクソーム・シークエンシング：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

ステップサンプル収集・選び(探しものが入っているはずのサンプル) Deep sequencing アラインメントバリアント・コールバリアント・アノテーションバリアントのクラス分け(機能予測) 対応遺伝子確認意義づけ公共サイト一覧(検出バリアントが載っている…

2014-01-18

7. Short ReadsからShort Tandem Readsの情報を取る：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

この章は、パス

2014-01-18

6. エクソーム・シークエンシングのためのShort Read Mapping：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

Short readsのマッピングツールは色々ある大別すると２つハッシュテーブルに落とし込む Burrows-Wheeler変換するどれを選んでも「あちらを立てればこちらが立たず」ツールの入出力特性評価、計算速度・リソース、などの比較は論文化されたりしているが…

2014-01-18

5. Deep Sequenceデータのアセンブル・アルゴリズム。基礎と気をつけるべきこと：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

どうして難しいかゲノム上に似た配列が山ほどある読まれたリードにエラーがあるカバレージが不均一 PCR増幅の影響データ量が莫大明るい側面 Paired-end(で情報量が多い)と楽 De novo assemblyのツール Edena,CABOG,De Bruijn graph,SOAPdenovo,MetaVelv…

2014-01-18

4. ハイ-スループットデータのカバー具合に関する統計モデル：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

場所によってたくさん読まれるところと少なく読まれるところがある興味は大きく分けて二つ読まれた部位に違い(多型とか)があるかもしれないときに、多型があるか、あるならアレルは何か、その割合の推定値はいくつか(ホモとヘテロだけであれば、ホモか、ヘ…

2014-01-18

3. Short Read Mapping の正確さ：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

マッピングの基礎知識マッピングでは読まれたリードの配列がreference配列のある部分の合致する部分を探して、その位置を決める長ければ長いほど配列の特異性は高く、特異的にマッピングされる(ゲノム上に１箇所だけが合致箇所と想定される)、短ければその…

2014-01-18

2. 配列データを圧縮する(GReEnで)：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー算術符号

大量のシークエンスデータが出るので、保管するにも移動するにも配列の圧縮は必須その圧縮ツールの一つを紹介算術符号(Arithmetic coding)に基礎を置く手法GReEn(入手はこちら)にある圧縮手法の一覧から算術符号という手法 "0110"という0/1でできた配列が…

2014-01-18

1. ハイ-スループット　シークエンス実験入門。実験デザインとバイオインフォマティクス解析：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

Raw data handling ->"CASAVA(Illumina)" Quality control and read manipulations ->CASAVA,FastQC De-novo Assembly Assemble -> SOAPdenovo, ABySS, Velvet, ALL-PATHS, Resequencing Mapping -> BWA, Bowtie, TopHat Variant calling -> SAMtools, GATK,…

2014-01-18

目次：ぱらぱらめくる『Deep Sequencing Data Analysis』

ぱらぱらめくるシリーズ Deep Sequencing 次世代シークエンサー

Deep Sequencing Data Analysis (Methods in Molecular Biology)作者: Noam Shomron出版社/メーカー: Humana Press発売日: 2013/07/30メディア: ハードカバーこの商品を含むブログを見る統計っぽいところを中心に『ぱらぱらめくる』ことにしたい６章までが…

2014-01-18

ぱらぱらめくる『Deep Sequencing Data Analysis』

2014-01-17

メモ

N <- 100 x <- seq(from=0,to=1,length=N) x <- x[c(-1,-N)] y <- x X <- c(40,40) Y <- c(40,5000) beta.x <- dbeta(x,X[1]+1,X[2]+1,log=TRUE) beta.y <- dbeta(y,Y[1]+1,Y[2]+1,log=TRUE) #prev.data <- c(560,1000) prev.data <- X+Y p <- x beta.p <- d…