2015-05-01から1ヶ月間の記事一覧

Property Testing

Property Testing Reviewという名のウェブサイト! Testing properties under Lp distances Lp-testing Property testingとdecision Property Testing: Current Research and Surveys (Lecture Notes in Computer Science)作者: Oded Goldreich出版社/メーカ…

Chernoff bound

Sublinear algorithmに多用されるChernoff boundはランダマイズド・アルゴリズムを用いて確率的にデータマイニングアウトプットをしたときの、そのアウトプットの確度を教えてくれる不等式 それに関する文書はいろいろみつかるけれど、わかりにくかったので…

ぱらぱらめくる『Randomized Algorithmsの講義』

サイト 1 Introduction: Randomized algorithms とは乱数を使って何かの推定をする。その推定値に(証明された)確率的上限・下限をつける 2 確率変数の値がどれくらい狭い範囲にまとまっているか:まとまり具合 Concentration of random variablesを示す不等式…

バリアントの機能予測ツールのリスト

American College of Medical Genetics and GenomicsとAssociation for Molecular Pathologyからの提案として、メンデル遺伝病のバリアントの病原性を5段階評定しよう、というものがありました Standards and guidelines for the interpretation of sequenc…

空間を抑える Sketching and streaming algorithms I & II & IIIの前半:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

Sketching and streaming algorithms IのPDF、同 II のPDF、同 III の前半のPDF いきなり「実例」が始まっている…ということは、要するに「こういう課題設定」なら「こういうsublinear algorithmがありますよ」という(ある意味で雑多な)カタログがsublinear …

補遺 確率変数の不等式

Markov 不等式 ある確率変数Xの値がt以上になる確率は、Xの期待値をtで割った値以下である # 取りうる値の種類数 n.val <- 10 # 正の確率変数値 v <- sort(runif(n.val)) library(MCMCpack) # 値別の生起確率 p <- rdirichlet(1,rep(1,n.val)) # 期待値 Ex <…

イントロダクション:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

イントロダクションのPDF Big dataを使う例 (1,2,...,n+1)の値のカードがあるときに、バラバラな順番にn枚のカードを見たとする。出ていないカードの値を当てるには、n+1個の値の出た・出ないを全部覚えておく必要はない(覚えておいても良い)。それまでに出…

ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

資料はこちら 構成 イントロダクション Sketching and streaming algorithms I Sketching and streaming algorithms II Sublinear-time algorithms I Sublinear-time algorithms II + Introduction to MapReduce

Sublinear algorithm

昨日の記事で色々な「大規模データ対策」の一つにsublinear algorithmという、データをスキャンしながら、全部のレコードを眺め渡すことなしに、答えを返す「軽い」方法のことが出てきた 調べてみる かいつまんで、かつ網羅的に一目でわかるサイトが見つから…

実用に関すること Sublinear-time algorithms IV:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

空間と時間とをsublinear化する例のPDF、ビッグデータの検定Lp検定のPDF、グラフ状のデータマイニングの例

Sublinear-time algorithms III後半:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

Sublinear-time algorithmsのPDF

確率変数の不等式を視覚的に理解する〜マルコフの不等式・チェビシェフの不等式〜

Wikipediaのこのページに沿ってとはどういうことかを順を追って視覚的に確認してみます 確率変数の不等式を視覚的に理解する: マルコフの不等式・チェビシェフの不等式作者: ryamada発売日: 2015/05/14メディア: Kindle版この商品を含むブログ (2件) を見る …

ぱらぱらめくる『Topological and Statistical Methods for Complex Data』

Topological and Statistical Methods for Complex Data: Tackling Large-Scale, High-Dimensional, and Multivariate Data Spaces (Mathematics and Visualization)作者: Janine Bennett,Fabien Vivodtzev,Valerio Pascucci出版社/メーカー: Springer発売日…

RFUシグナル強度と 正規・対数正規・ポアソン対数正規・二項分布 〜ノイズとシグナル、ホモとヘテロ〜

スライドはこちら RFUシグナル強度と正規・対数正規・ポアソン対数正規・二項分布: ノイズとシグナル、ホモとヘテロ作者: ryamada発売日: 2015/05/07メディア: Kindle版この商品を含むブログ (1件) を見る スライドの図表作成のためのRmd。スライドはデータ…

ぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction作者: Guido W. Imbens,Donald B. Rubin出版社/メーカー: Cambridge University Press発売日: 2015/04/06メディア: ハードカバーこの商品を含むブログを見る 目次 Part I…

Parts III,IV,V,VI 各論ぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

割り付けがどうなされているか・観察データの得られ方がどうなっているかによって、スタディを分類し、それぞれに対する手法があるので、それについての説明になっている 分類と帰属手法名とを目次を見て列挙するとよいだろう Part II Randomized Assignment…

Part I Introductionぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

1 Causality: The Basic Framework 2 A Brief History of the Potential Outcomes Approach to Causal Inference 3 A Classification of Assignment Mechanisms この本で扱う"Causality"について定義 "Potential Outcomes" Approach と言うのがこの本の肝 割…

ポアソン対数正規分布でDNA鑑定データを眺める

2015/06/10@法医学会年会の前日企画『法数学勉強会〜番外編』 前記事を基ネタとして DNA多型マーカーテンプレート量(ホモ・ヘテロ)が試料調整において、マーカー間ばらつき・アレル間ばらつきが入るとして、その上で、マーカーごとの単位DNAコピー数依存性の…

Bayesian Analysis of qRT-PCR Data

ペイパー MCMC.qpcrパッケージ(R)