データマイニング

1 Empirical Bayes and the James-Stein Estimator:もう一度ぱらぱらめくる『Large-Scale Inference』

何かしらの観測をしたときに、観測値から真値を推定しようとしている。今、何の事前情報もなければ、観測値そのものが真値である尤度が最も高い。単一対象に関する、無情報を前提とした最尤推定値が得られる。 一方、真値について事前分布を置き、観測値と真…

Foreword:もう一度ぱらぱらめくる『Large-Scale Inference』

データ解析の3時代区分 記述統計 実験/介入結果の解釈(ピアソン・フィッシャー・ノイマン・ホテリング) 大規模データの解釈 この本で目指すこと 大規模データ手法の共通基盤となる考え方の説明 Empirical Bayesと呼ぶ FDRが先例 この分野は未解決問題がある…

もう一度ぱらぱらめくる『Large-Scale Inference』

こちらでFDRに絡めて、この本の元ネタ資料をぱらぱらめくってある 再度、めくりなおすことにする Large-Scale Inference: Empirical Bayes Methods for Estimation, Testing, and Prediction (Institute of Mathematical Statistics Monographs)作者: Bradle…

EHRの臨床活用

レビュー(Mining electronic health records: towards better research applications and clinical care) EHR-driven genomic researchはこちら EHRに含まれるもの "Administrative data": 病院事務関係のデータ 保険等のシステムと「直結」 "Ancillary clin…

トリアージ メモ

Automated Message Triage - A Proposal for Supervised Semantic Classification of Messages テキストマイニング

属性選択

ちょっと調べもの こちらを参考に 属性選択 属性選択法の分類 A尺度 a1 距離尺度や a2 整合性尺度 など B 探索法 b1 ヒューリスティックス b2 完全性 b3 ランダムに探索するもの 手法の例 Relief:a1 x b1