2013-01-01から1年間の記事一覧

メソッド早読み:概説編

昨日、外部の勉強会に参加させていただき、ゲノム分野に身を置いて日の浅い方に論文を紹介していただいた 次世代シークエンサーを使ったゲノムとトランスクリプトームに関するNature論文で、本文は(articleだけれど)6ページ、メソッドを中心としたサプルが71…

James Stein 推定から非線形Shrinkageへ

複数の観測があるときに、それぞれの観測値の真値推定をするにあたり、観測値そのものにするより、「複数の観察を眺め渡して、そのばらつき・広がりより、少しきゅっと縮めた」値にしておく方がよいことが示せる その「きゅっと縮める」ことをShrinkageと言…

相互に関連した乱数

n個の正規乱数が、平均はすべて0で、covariance matrix に従って得られるとき、地道に自分で作れば、適当な正の正方行列を作って、その固有値分解をして正規直交基底方向の拡大縮小成分と回転成分とに分けておき、多次元標準正規乱数から拡大縮小と回転とを…

条件付期待値

関連する事項として以下、確認 条件付期待値(Wiki記事) 参考文献 以下の例でやってみよう Xは平均0、分散の正規分布に従っている。このXを観測誤差Z(ただし、平均0、分散の正規分布に従う)を伴ってYと観察するとする Yを観測した下でのXの期待値がであるとい…

Wienerフィルタ、カーネル法、スムージング

上記は、正規分布を仮定してそれにWienerフィルタをかませること。それはスペクトル分解して、その「主だったもの」を取り出すこと。そしてそれは正規分布の場合には全観測点をにらみあわせたときの最適推定になっていること。正規分布でないときには、最小…

すかすかなこと、と、神に託された不等式

これの続き こちらがPDF まだうまく読めるかどうかわからないので、ひとまず登場する用語をメモ 調和解析,フーリエ変換,ウェーブレット変換,推定,James Stein推定,Sparcity,Oracle inequalities,逆問題,時系列解析,Besov space,ウェーブレット縮退 Karhunen-…

周期性と巡回行列

周期性というのは時間に関して、時刻間の差によって観察値の違い(ばらつき)が規定され、その時刻の差は周期のmoduloとして定められる者と言える 時刻ごとの観察を変数として並べ、それらの関係を分散共分散行列として表すと、その行列は巡回行列になる Rで作…

単純な直線に沿った評価系と任意曲線での評価系

昨日の話の寄り道 昨日とはちょっと視点が変わるけれど、畳み込みと関数の相関は、積分される関数の取り方が「直交」的に異なっている 畳み込みでは、2つの関数が重なりあっているかどうかはという直線で評価されるのに対し、関数間の相関は評価軸がに沿っ…

かいつまむこと

こちらでたくさんの値を一括して観察したときに、個々の観察について推定する話の1つをやっている(まだ読み終わっていないけれど) 要するに、「たくさんの値を観察」して、それらが「全くの無縁であるわけではない」ときに、「一緒に観察した値を反映」させ…

Chap 1 イントロ:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

.Additive regression model 1年間365日の気温観測値。スプライン、周期性を考慮してのフーリエ変換など、方法は複数あるが、結果は似たり寄ったり フィットの良さと平滑の良さとはどちらも2次形式。両者の塩梅をするとそれは線形最適化 MMRのスパイクデー…

前書き:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

. Gaussian sequence model どんな内容かをキーワードで表す ノンパラ、関数推定、無限配列モデル、best-worst-case or minimax principle 線形、非線形、カーネル推定、平滑スプライン、丸めこみ、超直方体、楕球、Wavelet変換 Gaussian decision theory、K…

動機:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

どうしてこのPDFを読むのか フローサイトメトリのデータを中心に分布推定のことをやっている いわゆるカーネル分布推定は高次元のときに「すかすか」な問題があるのだけれど、そこを「じぃっ」と考えると、個々の観察点の周囲に多次元正規分布を想定してそれ…

Chap5 Linear Estimators and Pinsker’s Theorem:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

楕球を使って線形推定 KL divergenceが登場、それを使ったPinsker’s Asymptotic Minimaxity Theoremが。 ノルムによって定義されたSobolev space。微分の条件をゆるめると、バナッハ空間として扱える 『ソボレフ空間の重要性は、偏微分方程式の解というもの…

Chap 4 Gaussian decision theory:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

minimax で決断(仮想敵) どこにどれくらい出現するかで重みづけて空間全体で積分してminimax評価する サドルポイントを見つける そのために微分する

Chap 2 The multivariate normal distribution:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

正規分布のパラメタ推定は「基礎」 infinite dimensional Gaussian sequence modelはそれをベースにする。また、それはノンパラな性格を持つ James-Stein推定 n個の観察があってそれぞれ観察誤差があったときに、観察値そのものを推定値とするのはあり 観察…

Chap8 Thresholding and Oracle inequalities:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

ここで足切り、という作業はしばしば行われるが、それってどうやっているの?と言う話 Oracle inequalitiesというのは、それに関連する最近はやりの概念か(Wiki記事はないが、統計・推定・データマイニング関連のPDF等は多いようだ) "'Oracle inequalities' …

Chap7 A Primer on Estimation by Wavelet Shrinkage:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

多段階の解像度処理 Waveletと呼ばれる小さい波関数を使う。Wavelet関数は複数ある Wavelet変換のよい特徴の一つは、アルゴリズム(フーリエ変換よりさらに高速)であること 離散Wavelet変換と連続Wavelet変換とがある Wavelet shrinkage 推定 Shrinkage 推定…

Chap6 Adaptive Minimaxity over Ellipsoids:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

仮説パラメタ空間を楕球に閉じ込めると最適化ができるのでそれに関する話

Chap 3 The infinite Gaussian sequence model:ぱらぱらめくる『Gaussian estimation: Sequence and wavelet models』

あいかわらず正規分布なので、正規分布の確率密度関数と同じ形をした式が登場し、それをもとにminimax評価をする話が続く 「推定側」と「裏をかく側」とのせめぎ合い、ということだが、「裏をかく側」が完全に自由だとパラメタ推定にならないので、制限を入…

スタチン投与量戦略

シンバスタチン(その他のスタチンと薬剤代謝が違うので特に)はスタチン関連ミオパチーのリスクが高いとされている (シンバ)スタチン関連ミオパチーの遺伝的リスクとしては、SLCO1B1上のSNPが知られている 最近、ACC/AHAからアテローム硬化性心血管リスク低…

分布推定

ここ数日は方向推定の話が続いている 次元空間にのスカラーの分布があるときの推定や図示はカーネル分布推定・ヒストグラム 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのベクトルの分…

多次元空間のベクトル場推定と方向分布推定

方向分布と球

昨日、方向情報から母分布を、それは方向統計学か、と書いた 多項分布の共役事前分布は正単体(の周と内部)が母分布の台 じゃあ、方向分布のそれは…と考えると、それは球? 球の中心は全方向の一様分布に対応 球の周は、特定方向のみが起こるデルタ関数的分布…

ベクトル場での共役事前分布

こちらで点クラウドデータからグラフ化を介して交通量的な評価をして「重要なところ」というものを定量する話を書いた 「重要なところ」は「交通に関する情報量が多いところ」でもある 「情報量が多いところ」では、そこの「交通」についての推定精度が高い…

パスウェイの「分布評価」

日本人類遺伝学会のシンポジウムでの1つのトークのイントロでの話 複数のパスウェイがフェノタイプの成立に影響するときに、いくつかのパスウェイのうちの1つに変化が入るとフェノタイプ成立する、というモデルを…というものだった これの逆で、複数のパス…

グラフから「交通の要所」を絵にする

ちょっと退屈しのぎ 一端グラフが出来上がったら、「大事なノード」と「大事なエッジ」は、すべてのノード間の最短パスがどれくらい使うか、で評価してもよさそう 点クラウドからドロネー図を作り、そのグラフでそんな「要所」評価をしてみます この後、エッ…

交通の要所

エントリータイミングのパターン

こちらで生存解析にあたって、初期にエントリーバーストがあって、その後エントリーが定常化することについて書かれている そういえば生存解析について、以前にも書いた…(こちら) この記事にアイディアを得て、どんなモデルが作れるかを考えてみる できるだ…

Preface駆け足で読む『Bayesian Networks and Probabilistic Inference in Forensic Science』

何がこの本の動機か、と言えば、以下の質問に答えること 原因の集合と科学的証拠の集合との関係はいかなるものか。ただし、通常、原因は観察することができず、科学的証拠は観察できるものである。 1つまたは複数の判断すべき命題があったときに、それに関…

駆け足で読む『Bayesian Networks and Probabilistic Inference in Forensic Science』

Bayesian Networks and Probabilistic Inference in Forensic Science (Statistics in Practice)作者: Franco Taroni,Colin Aitken,Paolo Garbolino,Alex Biedermann出版社/メーカー: Wiley発売日: 2006/04/07メディア: ハードカバーこの商品を含むブログを…