2013-08-11から1日間の記事一覧

RでFDR

FDR R

こちらでENCODEプロジェクトの駆け足読み記事を書いている そのThread 02 でFDRという用語が出てくる たくさんの検定をやるシチュエーション 「ほぼすべての検定が帰無仮説に従っている」とみなすなら、ボンフェロニとかFWER的なマルチプルテスティング補正…

Appendix B Data Sets and Programs ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

著者のページ

Appendix A Exponential Families ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

この文書の数ページはかいつまんで書いてあるのだけれど、かいつまみ過ぎてついていきにくかったので、この文書の流れではなく再整理→こちら

Chapter 11 Prediction and Effect Size Estimation ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

帰無:対立の比率だけが数字でるだけではやはり足りない どのくらいの強さの因子なの?という話 それを個別に評価するのでなく、全体を使って個別のEffect sizeを。

Chapter 10 Combination, Relevance, and Comparability ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

解析構造が複雑になってきて、階層的にテストしたり…Permutationなどが強い世界 10.1 The Multi-Class Model 10.2 Small Subclasses and Enrichment 10.3 Relevance 10.4 Are Separate Analyses Legitimate? 10.5 Comparability

Chapter 9 Sets of Cases (Enrichment) ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

遺伝子を束ねてパスウェイ解析 9.1 Randomization and Permutation 9.2 Efficient Choice of a Scoring Function 9.3 A Correlation Model 9.4 Local Averaging

Chapter 8 Correlation Questions ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

FDRの話ではなく、塊のデータがあるときに気にすることについての話 Correlationを評価することで、推定値のaccuracyなども算出する(前章) 8.1 Row and Column Correlations もちろん気にする。クラスタリングしたりする対象だし 8.2 Estimating the Root Me…

Chapter 7 Estimation Accuracy ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

この後は、細部とかMicroarray の話一般、てな感じになってきますが… FDR,local FDRで数字を出したら、それって、信頼区間は?という話になるのはよくある話 リサンプリングするのも手 せっかくベイズで来たのだから、「理論」や「パーミュテーション(replac…

Chapter 6 Theoretical, Permutation and Empirical Null Distributions ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

ラージデータがあるなら、「理論」を信じるより実分布をみた方がよい 帰無仮説の分布はわかる、でも、たいていは帰無仮説に従っていない 6.1 Four examples 6.2 Empirical Null Estimation 観測データからNull分布を推定することに関する理論的説明 Empirica…

Chapter 5 Local False Discovery Rates ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

1テストのときにはずれた統計量が出ると、それは、何かしらの分布に照らしてp値化することになる。FDRのBH法もそのようにして出したp値がたくさん得られたときの話だった たくさんのテストを並列に実施するとp値だけでなくて、統計量自体がたくさん得られて…

Chapter 4 False Discovery Rate Control ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

FDRというのは、「何をもって閾値を決めるか」の態度の一つ。FDRと異なる態度が「タイプIエラー率を(たとえば)0.05にする」という態度。FDRの態度はそれとは違って、別のものをコントロールしようとしている 4.1 True and False Discoveries たくさんのテスト…

Chapter 3 Significance Testing Algorithms ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

古めの手法を見ておこう 3.1 p-Values and z-Values 1つのテストのために作られている たくさん並行してテストしたら分布を見ておかないと 特に、1つのテストで保守的に立ちつつ検定するようにできている(ことが多い)ので、たくさんをならべたときに、それ…

Chapter 2 Large-Scale Hypothesis Testing ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

21世紀に入って「ハイスループット」の時代。その要請としてLarge-scale hypothesis testing に対応する手法が生まれている。この関係は、Fisherの時代の農業の近代化の要請に似ている 2.1 A Microarray Example 数千以上の遺伝子、数十以上のサンプル…とい…

Chapter 1 Empirical Bayes and the James-Stein Estimator ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

考え方は1950年代に遡るが、同時並行でたくさんのデータ解析を行うようになって実問題に適用されるにいたった。その最初の適用対象がマイクロアレイ・体系的発現解析 (ベイズ)推定なのか、検定なのかの区別なども問題になる 1.1 ベイズ規則と多変量正規分布…

ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

資料(Stats 329) 目次 Chapter 1 Empirical Bayes and the James-Stein Estimator Chapter 2 Large-Scale Hypothesis Testing Chapter 3 Significance Testing Algorithms Chapter 4 False Discovery Rate Control Chapter 5 Local False Discovery Rates Ch…

BH法とlocal FDR法

FDRでは複数の検定統計量が与えられたときに、個々の検定について、「帰無仮説に合致しているか」「対立仮説に合致しているか」をfdr : 1-fdrという値で示す fdrが小さいほど、対立仮説により強く合致することを示す(検定p値も小さいほど、対立仮説らしさが…

FDRメモ