2015-01-01から1年間の記事一覧

インポータンス・サンプリングの基礎

あるドメインに生起確率分布があるとする そのドメインに、値があるとして、生起確率を考慮した期待値の推定をする このとき、モンテカルロで推定するとする どこもかしこも均一にランダム発生して値を計算してその平均をとるより 値確認をする頻度にバラツ…

インポータンス・サンプリング

こちらでモンテカルロ・シミュレーションについてメモした その中で重要になるのがインポータンス・サンプリング ネタPDF 構成 インポータンスサンプリングの基礎 Adaptive importance samplin Sequential importance sampling Annealed importance sampling…

遺伝率推定とMxとMixed Linear Model

遺伝率とその推定のためのACEモデル・アプリケーション"Mx" MxはStructural Equation Model Mixed Linear Model いずれにしろ、次のようなことが基本になる 表現型の分散共分散行列が、のように分解できて、この分散共分散行列に従う多次元正規分布の点(多次…

トレンド正確確率検定

2x3のSNP関連テーブルがあるとき、帰無仮説に基づいて、その正確生起確率を計算することは可能(周辺度数が与えられたときに置きうるすべてのテーブルについて) 起きうるすべてのテーブルについて、その生起確率の大小によって順序を定め、「観測テーブルと同…

ぱらぱらめくる『Computer simulations: tools for population and evolutionary genetics』

ペイパー Simulation strategies Forward Backward Ways to use Predictive uses Statistical inference Validating statistical methods Designing a simulation study For predictive uses For statistical inference Choosing simulation softwares

メモ

Graph Theory: Measures and Indices

How to provide uncertain information

NGS makes genetic counseling complicated. The followings are some notes on statistical aspects of interpretation of NGS for genetic counseling. Three validities (1) Conevntional genetic validity (2) New NGS-related validities (2-1) Analyti…

不確実な情報の提供

遺伝的バリアントについて調べてそれを伝えるとき、不確実性が問題になるわけだが、ここにあるように、analytic validity(実験は正確なの?) とclinical validity(見つけたバリアントは本物なの?)とについてうまく伝えることが必要。実際には、これに従来か…

Complexity, Compassion and Self-Organisation: Human Evolution and the Vulnerable Ape Hypothesis

論文はこちら 解説記事はこちら 簡単に言うと、脆弱・不利な表現型をもたらす個体も含めて生存しなくてはならないような小規模集団でのサバイバルが課された結果、みんなで協調・助け合ってやっていくという性質が定着した、と考えるのがよいのではないか、…

“Next Generation” Sequencing (NGS) guidelines for somatic genetic variant detection

2015年3月に出たガイドライン by ニューヨーク州 Departmen of Healthの抄訳(雑訳) このガイドラインとは別に" molecular oncology guidelinesもあります。これはこれでNGSとは別に基準として用いる SOP(Standard Operation Procedure) サンプル調整・デー…

ぱらぱらめくる『データ匿名化手法』

データ匿名化手法 ―ヘルスデータ事例に学ぶ個人情報保護作者: Khaled El Emam,Luk Arbuckle,木村映善,魔狸,笹井崇司出版社/メーカー: オライリージャパン発売日: 2015/05/23メディア: 単行本(ソフトカバー)この商品を含むブログ (8件) を見る 目次 1章 イ…

OMIC tools

ただのリンク

遺伝子とは

What is a gene, post-ENCODE? History and updated definition ENCODEとは 遺伝子の定義の歴史(その図) "Gene as a discrete heredity unit" "Gene as a distinct locus" linearly arranged "Gene as a physical molecule" Transfer of a molecule to modif…

ryamada本英語解説プロジェクト

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―作者: 山田亮出版社/メーカー: オーム社発売日: 2010/09/04メディア: 単行本(ソフトカバー)購入: 7人 クリック: 155回この商品を含むブログ (38件) を見る この本はこのブログに書き散らしたことを…

GEEとGLLAMMとで面倒くさいジェノタイプとフェノタイプを検定する

論文は関節リウマチの重症度スコアとHLA-DRBB1ハプロタイプとの関係を報告したもの(こちら) フェノタイプ:ラーセンスコア(骨レントゲン写真を基にスコア化したもの)、骨erosionの有り無し2値、死亡、DAS28(治療反応性を定量するスコア)。さらにそれらの経…

Property Testing

Property Testing Reviewという名のウェブサイト! Testing properties under Lp distances Lp-testing Property testingとdecision Property Testing: Current Research and Surveys (Lecture Notes in Computer Science)作者: Oded Goldreich出版社/メーカ…

Chernoff bound

Sublinear algorithmに多用されるChernoff boundはランダマイズド・アルゴリズムを用いて確率的にデータマイニングアウトプットをしたときの、そのアウトプットの確度を教えてくれる不等式 それに関する文書はいろいろみつかるけれど、わかりにくかったので…

ぱらぱらめくる『Randomized Algorithmsの講義』

サイト 1 Introduction: Randomized algorithms とは乱数を使って何かの推定をする。その推定値に(証明された)確率的上限・下限をつける 2 確率変数の値がどれくらい狭い範囲にまとまっているか:まとまり具合 Concentration of random variablesを示す不等式…

バリアントの機能予測ツールのリスト

American College of Medical Genetics and GenomicsとAssociation for Molecular Pathologyからの提案として、メンデル遺伝病のバリアントの病原性を5段階評定しよう、というものがありました Standards and guidelines for the interpretation of sequenc…

空間を抑える Sketching and streaming algorithms I & II & IIIの前半:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

Sketching and streaming algorithms IのPDF、同 II のPDF、同 III の前半のPDF いきなり「実例」が始まっている…ということは、要するに「こういう課題設定」なら「こういうsublinear algorithmがありますよ」という(ある意味で雑多な)カタログがsublinear …

補遺 確率変数の不等式

Markov 不等式 ある確率変数Xの値がt以上になる確率は、Xの期待値をtで割った値以下である # 取りうる値の種類数 n.val <- 10 # 正の確率変数値 v <- sort(runif(n.val)) library(MCMCpack) # 値別の生起確率 p <- rdirichlet(1,rep(1,n.val)) # 期待値 Ex <…

イントロダクション:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

イントロダクションのPDF Big dataを使う例 (1,2,...,n+1)の値のカードがあるときに、バラバラな順番にn枚のカードを見たとする。出ていないカードの値を当てるには、n+1個の値の出た・出ないを全部覚えておく必要はない(覚えておいても良い)。それまでに出…

ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

資料はこちら 構成 イントロダクション Sketching and streaming algorithms I Sketching and streaming algorithms II Sublinear-time algorithms I Sublinear-time algorithms II + Introduction to MapReduce

Sublinear algorithm

昨日の記事で色々な「大規模データ対策」の一つにsublinear algorithmという、データをスキャンしながら、全部のレコードを眺め渡すことなしに、答えを返す「軽い」方法のことが出てきた 調べてみる かいつまんで、かつ網羅的に一目でわかるサイトが見つから…

実用に関すること Sublinear-time algorithms IV:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

空間と時間とをsublinear化する例のPDF、ビッグデータの検定Lp検定のPDF、グラフ状のデータマイニングの例

Sublinear-time algorithms III後半:ぱらぱらめくるCrash course "Sublinear Algorithms for Big Datasets"

Sublinear-time algorithmsのPDF

確率変数の不等式を視覚的に理解する〜マルコフの不等式・チェビシェフの不等式〜

Wikipediaのこのページに沿ってとはどういうことかを順を追って視覚的に確認してみます 確率変数の不等式を視覚的に理解する: マルコフの不等式・チェビシェフの不等式作者: ryamada発売日: 2015/05/14メディア: Kindle版この商品を含むブログ (2件) を見る …

ぱらぱらめくる『Topological and Statistical Methods for Complex Data』

Topological and Statistical Methods for Complex Data: Tackling Large-Scale, High-Dimensional, and Multivariate Data Spaces (Mathematics and Visualization)作者: Janine Bennett,Fabien Vivodtzev,Valerio Pascucci出版社/メーカー: Springer発売日…

RFUシグナル強度と 正規・対数正規・ポアソン対数正規・二項分布 〜ノイズとシグナル、ホモとヘテロ〜

スライドはこちら RFUシグナル強度と正規・対数正規・ポアソン対数正規・二項分布: ノイズとシグナル、ホモとヘテロ作者: ryamada発売日: 2015/05/07メディア: Kindle版この商品を含むブログ (1件) を見る スライドの図表作成のためのRmd。スライドはデータ…

ぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction作者: Guido W. Imbens,Donald B. Rubin出版社/メーカー: Cambridge University Press発売日: 2015/04/06メディア: ハードカバーこの商品を含むブログを見る 目次 Part I…