2015-05-01から1ヶ月間の記事一覧
Property Testing Reviewという名のウェブサイト! Testing properties under Lp distances Lp-testing Property testingとdecision Property Testing: Current Research and Surveys (Lecture Notes in Computer Science)作者: Oded Goldreich出版社/メーカ…
Sublinear algorithmに多用されるChernoff boundはランダマイズド・アルゴリズムを用いて確率的にデータマイニングアウトプットをしたときの、そのアウトプットの確度を教えてくれる不等式 それに関する文書はいろいろみつかるけれど、わかりにくかったので…
サイト 1 Introduction: Randomized algorithms とは乱数を使って何かの推定をする。その推定値に(証明された)確率的上限・下限をつける 2 確率変数の値がどれくらい狭い範囲にまとまっているか:まとまり具合 Concentration of random variablesを示す不等式…
American College of Medical Genetics and GenomicsとAssociation for Molecular Pathologyからの提案として、メンデル遺伝病のバリアントの病原性を5段階評定しよう、というものがありました Standards and guidelines for the interpretation of sequenc…
Sketching and streaming algorithms IのPDF、同 II のPDF、同 III の前半のPDF いきなり「実例」が始まっている…ということは、要するに「こういう課題設定」なら「こういうsublinear algorithmがありますよ」という(ある意味で雑多な)カタログがsublinear …
Markov 不等式 ある確率変数Xの値がt以上になる確率は、Xの期待値をtで割った値以下である # 取りうる値の種類数 n.val <- 10 # 正の確率変数値 v <- sort(runif(n.val)) library(MCMCpack) # 値別の生起確率 p <- rdirichlet(1,rep(1,n.val)) # 期待値 Ex <…
イントロダクションのPDF Big dataを使う例 (1,2,...,n+1)の値のカードがあるときに、バラバラな順番にn枚のカードを見たとする。出ていないカードの値を当てるには、n+1個の値の出た・出ないを全部覚えておく必要はない(覚えておいても良い)。それまでに出…
資料はこちら 構成 イントロダクション Sketching and streaming algorithms I Sketching and streaming algorithms II Sublinear-time algorithms I Sublinear-time algorithms II + Introduction to MapReduce
昨日の記事で色々な「大規模データ対策」の一つにsublinear algorithmという、データをスキャンしながら、全部のレコードを眺め渡すことなしに、答えを返す「軽い」方法のことが出てきた 調べてみる かいつまんで、かつ網羅的に一目でわかるサイトが見つから…
空間と時間とをsublinear化する例のPDF、ビッグデータの検定Lp検定のPDF、グラフ状のデータマイニングの例
Sublinear-time algorithmsのPDF
Wikipediaのこのページに沿ってとはどういうことかを順を追って視覚的に確認してみます 確率変数の不等式を視覚的に理解する: マルコフの不等式・チェビシェフの不等式作者: ryamada発売日: 2015/05/14メディア: Kindle版この商品を含むブログ (2件) を見る …
Topological and Statistical Methods for Complex Data: Tackling Large-Scale, High-Dimensional, and Multivariate Data Spaces (Mathematics and Visualization)作者: Janine Bennett,Fabien Vivodtzev,Valerio Pascucci出版社/メーカー: Springer発売日…
スライドはこちら RFUシグナル強度と正規・対数正規・ポアソン対数正規・二項分布: ノイズとシグナル、ホモとヘテロ作者: ryamada発売日: 2015/05/07メディア: Kindle版この商品を含むブログ (1件) を見る スライドの図表作成のためのRmd。スライドはデータ…
Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction作者: Guido W. Imbens,Donald B. Rubin出版社/メーカー: Cambridge University Press発売日: 2015/04/06メディア: ハードカバーこの商品を含むブログを見る 目次 Part I…
割り付けがどうなされているか・観察データの得られ方がどうなっているかによって、スタディを分類し、それぞれに対する手法があるので、それについての説明になっている 分類と帰属手法名とを目次を見て列挙するとよいだろう Part II Randomized Assignment…
1 Causality: The Basic Framework 2 A Brief History of the Potential Outcomes Approach to Causal Inference 3 A Classification of Assignment Mechanisms この本で扱う"Causality"について定義 "Potential Outcomes" Approach と言うのがこの本の肝 割…
2015/06/10@法医学会年会の前日企画『法数学勉強会〜番外編』 前記事を基ネタとして DNA多型マーカーテンプレート量(ホモ・ヘテロ)が試料調整において、マーカー間ばらつき・アレル間ばらつきが入るとして、その上で、マーカーごとの単位DNAコピー数依存性の…
ペイパー MCMC.qpcrパッケージ(R)