2015-01-01から1年間の記事一覧

Parts III,IV,V,VI 各論ぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

割り付けがどうなされているか・観察データの得られ方がどうなっているかによって、スタディを分類し、それぞれに対する手法があるので、それについての説明になっている 分類と帰属手法名とを目次を見て列挙するとよいだろう Part II Randomized Assignment…

Part I Introductionぱらぱらめくる『Causal Inference for Statistics, Social, and Biomedical Sciences』

1 Causality: The Basic Framework 2 A Brief History of the Potential Outcomes Approach to Causal Inference 3 A Classification of Assignment Mechanisms この本で扱う"Causality"について定義 "Potential Outcomes" Approach と言うのがこの本の肝 割…

ポアソン対数正規分布でDNA鑑定データを眺める

2015/06/10@法医学会年会の前日企画『法数学勉強会〜番外編』 前記事を基ネタとして DNA多型マーカーテンプレート量(ホモ・ヘテロ)が試料調整において、マーカー間ばらつき・アレル間ばらつきが入るとして、その上で、マーカーごとの単位DNAコピー数依存性の…

Bayesian Analysis of qRT-PCR Data

ペイパー MCMC.qpcrパッケージ(R)

生命科学インフォマティクスに求められる標準スキル

ゲノムインフォマティクスに関する調べものをしていて、おもしろい資料に行き当たった その名も「Life Science Infromatics Skill Standards」(こちら) かなりな量になるが、抜き出して行こうと思う(まだ、書きかけです) 文書構成 概観 ライフサイエンス(LS)…

ゲノムインフォマティクスとは、を説明するための資料リンク

Informatics総論 science, technology, engineering and mathematics (STEM) Bioinformatics(Wiki) Life Science Informatics Skill Standards NIH genome-informatics Program The Importance of an Integrated Informatics Solution for Life Science Orga…

Gene Set Enrichment Analysis

Evaluating Gene Set Enrichment Analysis Via a Hybrid Data Model (元ネタ論文) 基本 マイクロアレイデータで、遺伝子発現の差があるかどうかを見る すべての遺伝子を個別に調べるとマルチプルテスティングで希釈されて見えなくなるので、遺伝子をセットに…

SeqGSEA

パッケージに関する記事サイト そこからの引用 The package generally provides methods for gene set enrichment analysis of high-throughput RNA-Seq data by integrating differential expression and splicing. It uses negative binomial distribution…

ぱらぱらめくる『Stochastic Models, Information Theory, and Lie Groups』

この本は最終的には、確率・統計・解析に関することにつながるようだが、難所の多くが幾何・多様体・微積・ベクトル解析などになりそうなので、こちらのブルーブログに書いておくことにする。 Stochastic Models, Information Theory, and Lie Groups, Volum…

カーネル どこでまとまるのか

昨日の記事で、カーネルPCAを含むPCAの色々について書いた この『カーネル』という単語がクセモノで、わかりにくい Wikipediaのカーネルの曖昧さ回避の日本語ページ(こちらは大したこともないし、数学・統計関係も統計・学習で用いるカーネル関数と、線形空…

PCAとその発展(カーネルPCA、欠測値対応、latent variable-PCA,GP-LVM)

参考 Rmdで書いてみる PCAとその周辺のために、Rのパッケージkernlab,pcaMethods,dmtを使って、処理をなぞってみる 基本的には固有値分解という、よいライブラリが準備されていて解釈も簡単な線形代数計算に帰着させよう、という手法で、一番基本的ないわゆ…

PCAとその発展(カーネルPCA、欠測値対応、latent variable-PCA,GP-LV

PCAとサポートベクターマシン

サポートベクターマシンはマシンラーニングの基本 Matlabとか数値計算系で実装が先行していて、Rでは追随、という形 パッケージe1071が先行のlibsvmとかを実装しているそうだ kernlabっていうのものサポートベクターマシンの基本的な手法をサポートすること…

PCAと欠測値ありのPCA

PCAは少ない軸で高次元データを説明する手法(べたにやるならこちらとか) 欠測値がないことを前提にして作られている じゃあ欠測値があるときには、というと、足りないところを埋めながらPCAすることになる。埋めてからPCAする、というのもありだが、PCAしな…

Actionable〜一つの考え方

こちらにActionableなデータ・データサマリーに関する記事がある 二つの立場からのActionabilityについて書いている データ解析者・データ解析結果を提示する人、という立場からのactionableデータの特徴 Trusted ; Based on credible data, generated in a …

遺伝情報の返却について

先日の記事でNGSデータから得られた情報の扱いについて書いたけれど、その姉妹編(今日の記事が本編化) ゲノム研究参加者への情報伝達について(The Clinical Sequencing Exploratory Research (CSER) Consortium and the Electronic Medical Records and Geno…

sQTL GLiMMPS

論文 背景モデルの説明PDF アプリのサイト 概要 NGSでデータを取ると、エクソンが抜けるか抜けないかについて、「抜けていないことが確実なリード(対象エクソンとその前後どちらかのエクソンとにまたがったリード)本数と、エクソンをスキップしたことが確実…

SNPでIBD〜MCMC_IBDfinderを使う

これがペイパー 個人のSNPフェーズ不明データから、個人ペアごとに処理してIBD範囲を推定する方法は多いが(Relate,PLINK,BEAGLE,GERMLINEとか(詳細は知らないのですが、MCMC_IBDfinderのペイパーの記載によれば、ということで))、MCMC_IBDfinderは3人以上い…

私のための量子力学メモ3 自分の躓きを整理する

こちらやこちらで量子力学のことをメモしている。その続き ハミルトニアン、エネルギー保存の法則、運動量・位置座標、最小作用の法則、運動方程式 エネルギーは運動エネルギーと位置エネルギーの和 ハミルトニアンはエネルギーを表したものに相当 状態Xから…

私のための量子力学メモ2 正規分布と調和振動子

こちらに確率密度分布で世の中を考える方法としての量子力学、という意味合いで、量子力学の基礎事項をメモした その少し具体化したメモ 調和振動子というのがある。ばねにつながれたおもりが、行ったり来たりするやつが古典力学版 運動エネルギーと、ばねの…

臨床的意義が高いとされた56バリアント ACMG policy statement: updated recommendations regarding analysis and reporting of secondary findings in clinical genome-scale sequencing

こちら Hereditary breast and ovarian cancer BRCA1 BRCA2 Li-Fraumeni syndrome TP53 Peutz-Jeghers syndeome STK11 Lynch syndrome MLH1 MSH2 MSH6 PMS2 Familial adenomatous polyposis APC MYH-associated polyposis;adenomas, multiple colorectal, FA…

ACMG policy statement: updated recommendations regarding analysis and reporting of secondary findings in clinical genome-scale sequencing

PDF 臨床的に行われたゲノムワイドシークエンシングによって、二次的に・意図せずに見つかる遺伝的ファインディングズの取扱いについて これが書かれた時点(Genetics in Medicine (2014) 17, 68 11;69 )で知見が強いとみなしうる「56 genes」については、患…

ACMG clinical laboratory standards for next-generation sequencing (2013)

2013にAmerican College of Medical Geneticsが出したNGSの臨床利用に関するガイドライン 遅まきながらメモ PDF 構成を書き出すだけでも一苦労ですが… 基本的には留意点の網羅的列挙となっており、実用にあたっては、遺伝学者・臨床家・臨床検査家が注意深く…

ACMG policy statement: updated recommendations regarding analysi

私のための量子力学メモ

こちらで量子力学・行列力学・作用素環についてメモしている 自分のための量子力学としては、確率事象空間における離散性の扱いと量子力学との関係が大事 波動方程式という確率密度分布の時間変化情報 自由粒子というものがある。無限空間に「粒子」があり、…

遺伝子による確率論的決定機構

雑多に広がる確率離散過程に関する話題提供のための構成メモ 主軸はゲノム・遺伝因子 遺伝因子をエピゲノム・トランスクリプトームと絡めるための、スイッチオンオフモデル その確率論的制御 どのようにしてそのような仕組みの歴史的構成が可能かについての…

多スイッチオンオフモデル〜遺伝子による確率論的決定機構

スイッチのオンオフはスイッチ数pのとき、個の頂点を持つp次元単位格子上の状態推移として考えられる この酔歩にあって、ノードに存在確率の濃淡を作るには、あるノードには、流入しやすいけれど流出しにくい、ということを実現することが必要だ 何がそのよ…

DNA鑑定にポアソン対数正規分布

昨日の記事や一昨日の記事に対数正規分布・ポアソン対数正規分布のことをメモした 常染色体上のSTRをPCR増幅をかませた実験によってピークシグナル型データを取得し、それに基づいてDNA型タイピングをするやり方がある そのデータについて、対数正規分布・ポ…

ポアソン対数正規分布

昨日、対数正規分布についてメモした その離散版。ポアソン対数正規分布 こちらのqRT-PCRとか、こちらの細菌検出とかで使われている ポアソン分布のパラメタが対数正規分布に従っているとして計算しているらしい poilogなるパッケージがあって、dpoilog(),rp…

対数正規分布

対数正規分布は、supportが正の値をとる連続分布で、生命現象を含む自然現象に広くみられる分布(こちらのFacultyOf1000 Prime)にもあるように Rの対数正規分布に関する関数はdlnorm(),plnorm(),qlnorm(),rlnorm()の一式なのだが、ちょっと使いづらいかもしれ…