2013-11-01から1ヶ月間の記事一覧

Chap 1 イントロ:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

.Additive regression model 1年間365日の気温観測値。スプライン、周期性を考慮してのフーリエ変換など、方法は複数あるが、結果は似たり寄ったり フィットの良さと平滑の良さとはどちらも2次形式。両者の塩梅をするとそれは線形最適化 MMRのスパイクデー…

前書き:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

. Gaussian sequence model どんな内容かをキーワードで表す ノンパラ、関数推定、無限配列モデル、best-worst-case or minimax principle 線形、非線形、カーネル推定、平滑スプライン、丸めこみ、超直方体、楕球、Wavelet変換 Gaussian decision theory、K…

動機:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

どうしてこのPDFを読むのか フローサイトメトリのデータを中心に分布推定のことをやっている いわゆるカーネル分布推定は高次元のときに「すかすか」な問題があるのだけれど、そこを「じぃっ」と考えると、個々の観察点の周囲に多次元正規分布を想定してそれ…

Chap5 Linear Estimators and Pinsker’s Theorem:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

楕球を使って線形推定 KL divergenceが登場、それを使ったPinsker’s Asymptotic Minimaxity Theoremが。 ノルムによって定義されたSobolev space。微分の条件をゆるめると、バナッハ空間として扱える 『ソボレフ空間の重要性は、偏微分方程式の解というもの…

Chap 4 Gaussian decision theory:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

minimax で決断(仮想敵) どこにどれくらい出現するかで重みづけて空間全体で積分してminimax評価する サドルポイントを見つける そのために微分する

Chap 2 The multivariate normal distribution:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

正規分布のパラメタ推定は「基礎」 infinite dimensional Gaussian sequence modelはそれをベースにする。また、それはノンパラな性格を持つ James-Stein推定 n個の観察があってそれぞれ観察誤差があったときに、観察値そのものを推定値とするのはあり 観察…

Chap8 Thresholding and Oracle inequalities:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

ここで足切り、という作業はしばしば行われるが、それってどうやっているの?と言う話 Oracle inequalitiesというのは、それに関連する最近はやりの概念か(Wiki記事はないが、統計・推定・データマイニング関連のPDF等は多いようだ) "'Oracle inequalities' …

Chap7 A Primer on Estimation by Wavelet Shrinkage:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

多段階の解像度処理 Waveletと呼ばれる小さい波関数を使う。Wavelet関数は複数ある Wavelet変換のよい特徴の一つは、アルゴリズム(フーリエ変換よりさらに高速)であること 離散Wavelet変換と連続Wavelet変換とがある Wavelet shrinkage 推定 Shrinkage 推定…

Chap6 Adaptive Minimaxity over Ellipsoids:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

仮説パラメタ空間を楕球に閉じ込めると最適化ができるのでそれに関する話

Chap 3 The infinite Gaussian sequence model:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

あいかわらず正規分布なので、正規分布の確率密度関数と同じ形をした式が登場し、それをもとにminimax評価をする話が続く 「推定側」と「裏をかく側」とのせめぎ合い、ということだが、「裏をかく側」が完全に自由だとパラメタ推定にならないので、制限を入…

スタチン投与量戦略

シンバスタチン(その他のスタチンと薬剤代謝が違うので特に)はスタチン関連ミオパチーのリスクが高いとされている (シンバ)スタチン関連ミオパチーの遺伝的リスクとしては、SLCO1B1上のSNPが知られている 最近、ACC/AHAからアテローム硬化性心血管リスク低…

分布推定

ここ数日は方向推定の話が続いている 次元空間にのスカラーの分布があるときの推定や図示はカーネル分布推定・ヒストグラム 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのベクトルの分…

多次元空間のベクトル場推定と方向分布推定

方向分布と球

昨日、方向情報から母分布を、それは方向統計学か、と書いた 多項分布の共役事前分布は正単体(の周と内部)が母分布の台 じゃあ、方向分布のそれは…と考えると、それは球? 球の中心は全方向の一様分布に対応 球の周は、特定方向のみが起こるデルタ関数的分布…

ベクトル場での共役事前分布

こちらで点クラウドデータからグラフ化を介して交通量的な評価をして「重要なところ」というものを定量する話を書いた 「重要なところ」は「交通に関する情報量が多いところ」でもある 「情報量が多いところ」では、そこの「交通」についての推定精度が高い…

パスウェイの「分布評価」

日本人類遺伝学会のシンポジウムでの1つのトークのイントロでの話 複数のパスウェイがフェノタイプの成立に影響するときに、いくつかのパスウェイのうちの1つに変化が入るとフェノタイプ成立する、というモデルを…というものだった これの逆で、複数のパス…

グラフから「交通の要所」を絵にする

ちょっと退屈しのぎ 一端グラフが出来上がったら、「大事なノード」と「大事なエッジ」は、すべてのノード間の最短パスがどれくらい使うか、で評価してもよさそう 点クラウドからドロネー図を作り、そのグラフでそんな「要所」評価をしてみます この後、エッ…

交通の要所

エントリータイミングのパターン

こちらで生存解析にあたって、初期にエントリーバーストがあって、その後エントリーが定常化することについて書かれている そういえば生存解析について、以前にも書いた…(こちら) この記事にアイディアを得て、どんなモデルが作れるかを考えてみる できるだ…

Preface駆け足で読む『Bayesian Networks and Probabilistic Inference in Forensic Science』

何がこの本の動機か、と言えば、以下の質問に答えること 原因の集合と科学的証拠の集合との関係はいかなるものか。ただし、通常、原因は観察することができず、科学的証拠は観察できるものである。 1つまたは複数の判断すべき命題があったときに、それに関…

駆け足で読む『Bayesian Networks and Probabilistic Inference in Forensic Science』

Bayesian Networks and Probabilistic Inference in Forensic Science (Statistics in Practice)作者: Franco Taroni,Colin Aitken,Paolo Garbolino,Alex Biedermann出版社/メーカー: Wiley発売日: 2006/04/07メディア: ハードカバーこの商品を含むブログを…

Repeated Measures ANOVA (3)

今、検出したいのは、個人のばらばらを考慮した上で、groupごとに時間経過での違いがあること(Withinのgroup:time項が有意であること) > demo3 <- read.csv("http://www.ats.ucla.edu/stat/data/demo3.csv") > ## Convert variables to factor > demo3 <- wi…

Repeated Measures ANOVA (2)

Strataでまとめること 前の記事で個人をグループに振り分けて3時刻で測定するという例を扱った。このとき、個人の特性がばらつきをもたらすことを前提に解析していた それを個人と言うStrataでまとめる、と言っている 再度、出力を見直してみる Error: idと…

Repeated Measures ANOVA

リンクを集めているページ(こちら) まずはここ(UCLA)のサイトに行ってみよう 例1 demo1 <- read.csv("http://www.ats.ucla.edu/stat/data/demo1.csv") ## Convert variables to factor demo1 <- within(demo1, { group <- factor(group) time <- factor(tim…

Repeated Measures ANOVA (4)

初期値依存のとき 時系列で記録する。グループ別に記録する。ただし、時刻0での値は、ある状態を反映しているので、それを織り込むことが妥当だとする 以下で解析しているのは、次に示すグラフ(左は2群を併せたもの、中央と右が群別の経過)のうち上の方の区…

メモ

上の記事でF分布についてメモした 少しANOVAを。こちらも参考 n.iter <- 1000 ret <- rep(0,n.iter) n.g <- 2 n.s <- 200 for(i in 1:n.iter){ X <- rnorm(n.s) P <- sample(1:n.g,n.s,replace=TRUE) s1 <- which(P==1) s2 <- which(P==2) ret[i] <- t.test(…

F分布

F分布はカイ二乗分布の比と関係がある # 2つのカイ二乗分布乱数を発生させる d1 <- 3 d2 <- 5 q1 <- rchisq(1000,d1) q2 <- rchisq(1000,d2) # カイ二乗分布乱数を自由度で割ったものの比がF統計量 f <- (q1/d1)/(q2/d2) # F統計量は構成元の二つの自由度の…