2013-08-01から1ヶ月間の記事一覧
FDRの話ではなく、塊のデータがあるときに気にすることについての話 Correlationを評価することで、推定値のaccuracyなども算出する(前章) 8.1 Row and Column Correlations もちろん気にする。クラスタリングしたりする対象だし 8.2 Estimating the Root Me…
この後は、細部とかMicroarray の話一般、てな感じになってきますが… FDR,local FDRで数字を出したら、それって、信頼区間は?という話になるのはよくある話 リサンプリングするのも手 せっかくベイズで来たのだから、「理論」や「パーミュテーション(replac…
ラージデータがあるなら、「理論」を信じるより実分布をみた方がよい 帰無仮説の分布はわかる、でも、たいていは帰無仮説に従っていない 6.1 Four examples 6.2 Empirical Null Estimation 観測データからNull分布を推定することに関する理論的説明 Empirica…
1テストのときにはずれた統計量が出ると、それは、何かしらの分布に照らしてp値化することになる。FDRのBH法もそのようにして出したp値がたくさん得られたときの話だった たくさんのテストを並列に実施するとp値だけでなくて、統計量自体がたくさん得られて…
FDRというのは、「何をもって閾値を決めるか」の態度の一つ。FDRと異なる態度が「タイプIエラー率を(たとえば)0.05にする」という態度。FDRの態度はそれとは違って、別のものをコントロールしようとしている 4.1 True and False Discoveries たくさんのテスト…
古めの手法を見ておこう 3.1 p-Values and z-Values 1つのテストのために作られている たくさん並行してテストしたら分布を見ておかないと 特に、1つのテストで保守的に立ちつつ検定するようにできている(ことが多い)ので、たくさんをならべたときに、それ…
21世紀に入って「ハイスループット」の時代。その要請としてLarge-scale hypothesis testing に対応する手法が生まれている。この関係は、Fisherの時代の農業の近代化の要請に似ている 2.1 A Microarray Example 数千以上の遺伝子、数十以上のサンプル…とい…
考え方は1950年代に遡るが、同時並行でたくさんのデータ解析を行うようになって実問題に適用されるにいたった。その最初の適用対象がマイクロアレイ・体系的発現解析 (ベイズ)推定なのか、検定なのかの区別なども問題になる 1.1 ベイズ規則と多変量正規分布…
資料(Stats 329) 目次 Chapter 1 Empirical Bayes and the James-Stein Estimator Chapter 2 Large-Scale Hypothesis Testing Chapter 3 Significance Testing Algorithms Chapter 4 False Discovery Rate Control Chapter 5 Local False Discovery Rates Ch…
FDRでは複数の検定統計量が与えられたときに、個々の検定について、「帰無仮説に合致しているか」「対立仮説に合致しているか」をfdr : 1-fdrという値で示す fdrが小さいほど、対立仮説により強く合致することを示す(検定p値も小さいほど、対立仮説らしさが…
DHS(DNaseI Hypersensitivity Sites)(クロマチン構造が緩んでいるところ)が205,109箇所(セルライン平均)ある(FDR1% でポジティブ扱い)。ゲノムの1%くらい…(FDRで1%なのとこの1%なのとはたまたま??) ヒストンメチル化のパターンはTF結合部位に関して…
サイト(01) 転写因子結合部位モチーフ(配列のパターン) 実験設定 DNA-binding proteins 119個 72 cell typesとそれらが持つ多数のRNA polymerase構成因子 ChIP-seq 結果概要 87/119個のDNA-binding proteingsが配列特異的転写因子(TFSS:Transcription Factor…
ENCODE explorerでは多数の解析・論文をThreadsと呼ぶものでトピック別に再編しなおしている 複数の論文が転写因子について書いていて、個々の論文では転写因子に関する記載が論文の中の一部である、というようになっている これだと、「転写因子」について…
ENCODE(The Encyclopedia of DNA Elements) プロジェクトの略 National Human Genome Research Instituteが資金提供するプロジェクトで、ヒトゲノム全領域の転写、転写因子の関連、クロマチン構造とヒストン修飾についてのリスト化を目指す それらの同定とア…
ENCODE(The Encyclopedia of DNA Elements) projectをウェブでサーフするサイトが"nature ENCODE explorer"(こちら) 上から読み降ろして行く文章形式ではないので『駆け足で読む』のには少し面倒くさい点もあるのだが、解析の種類も豊富だし、図表もきれいな…
統計遺伝学では、医学関連のデータがなんでもやってくる。基礎系・臨床系を問わず 非医学系出身の大学院生は医学概論の単位を取得することで医学の概観をつかむことを制度上は求められるわけだが、 医学科の6年間で 『講義としての医学概論→正常の基礎医学→…