2015-01-01から1年間の記事一覧
割り付けがどうなされているか・観察データの得られ方がどうなっているかによって、スタディを分類し、それぞれに対する手法があるので、それについての説明になっている 分類と帰属手法名とを目次を見て列挙するとよいだろう Part II Randomized Assignment…
1 Causality: The Basic Framework 2 A Brief History of the Potential Outcomes Approach to Causal Inference 3 A Classification of Assignment Mechanisms この本で扱う"Causality"について定義 "Potential Outcomes" Approach と言うのがこの本の肝 割…
2015/06/10@法医学会年会の前日企画『法数学勉強会〜番外編』 前記事を基ネタとして DNA多型マーカーテンプレート量(ホモ・ヘテロ)が試料調整において、マーカー間ばらつき・アレル間ばらつきが入るとして、その上で、マーカーごとの単位DNAコピー数依存性の…
ペイパー MCMC.qpcrパッケージ(R)
ゲノムインフォマティクスに関する調べものをしていて、おもしろい資料に行き当たった その名も「Life Science Infromatics Skill Standards」(こちら) かなりな量になるが、抜き出して行こうと思う(まだ、書きかけです) 文書構成 概観 ライフサイエンス(LS)…
Informatics総論 science, technology, engineering and mathematics (STEM) Bioinformatics(Wiki) Life Science Informatics Skill Standards NIH genome-informatics Program The Importance of an Integrated Informatics Solution for Life Science Orga…
Evaluating Gene Set Enrichment Analysis Via a Hybrid Data Model (元ネタ論文) 基本 マイクロアレイデータで、遺伝子発現の差があるかどうかを見る すべての遺伝子を個別に調べるとマルチプルテスティングで希釈されて見えなくなるので、遺伝子をセットに…
パッケージに関する記事サイト そこからの引用 The package generally provides methods for gene set enrichment analysis of high-throughput RNA-Seq data by integrating differential expression and splicing. It uses negative binomial distribution…
この本は最終的には、確率・統計・解析に関することにつながるようだが、難所の多くが幾何・多様体・微積・ベクトル解析などになりそうなので、こちらのブルーブログに書いておくことにする。 Stochastic Models, Information Theory, and Lie Groups, Volum…
昨日の記事で、カーネルPCAを含むPCAの色々について書いた この『カーネル』という単語がクセモノで、わかりにくい Wikipediaのカーネルの曖昧さ回避の日本語ページ(こちらは大したこともないし、数学・統計関係も統計・学習で用いるカーネル関数と、線形空…
参考 Rmdで書いてみる PCAとその周辺のために、Rのパッケージkernlab,pcaMethods,dmtを使って、処理をなぞってみる 基本的には固有値分解という、よいライブラリが準備されていて解釈も簡単な線形代数計算に帰着させよう、という手法で、一番基本的ないわゆ…
サポートベクターマシンはマシンラーニングの基本 Matlabとか数値計算系で実装が先行していて、Rでは追随、という形 パッケージe1071が先行のlibsvmとかを実装しているそうだ kernlabっていうのものサポートベクターマシンの基本的な手法をサポートすること…
PCAは少ない軸で高次元データを説明する手法(べたにやるならこちらとか) 欠測値がないことを前提にして作られている じゃあ欠測値があるときには、というと、足りないところを埋めながらPCAすることになる。埋めてからPCAする、というのもありだが、PCAしな…
こちらにActionableなデータ・データサマリーに関する記事がある 二つの立場からのActionabilityについて書いている データ解析者・データ解析結果を提示する人、という立場からのactionableデータの特徴 Trusted ; Based on credible data, generated in a …
先日の記事でNGSデータから得られた情報の扱いについて書いたけれど、その姉妹編(今日の記事が本編化) ゲノム研究参加者への情報伝達について(The Clinical Sequencing Exploratory Research (CSER) Consortium and the Electronic Medical Records and Geno…
論文 背景モデルの説明PDF アプリのサイト 概要 NGSでデータを取ると、エクソンが抜けるか抜けないかについて、「抜けていないことが確実なリード(対象エクソンとその前後どちらかのエクソンとにまたがったリード)本数と、エクソンをスキップしたことが確実…
これがペイパー 個人のSNPフェーズ不明データから、個人ペアごとに処理してIBD範囲を推定する方法は多いが(Relate,PLINK,BEAGLE,GERMLINEとか(詳細は知らないのですが、MCMC_IBDfinderのペイパーの記載によれば、ということで))、MCMC_IBDfinderは3人以上い…
こちらやこちらで量子力学のことをメモしている。その続き ハミルトニアン、エネルギー保存の法則、運動量・位置座標、最小作用の法則、運動方程式 エネルギーは運動エネルギーと位置エネルギーの和 ハミルトニアンはエネルギーを表したものに相当 状態Xから…
こちらに確率密度分布で世の中を考える方法としての量子力学、という意味合いで、量子力学の基礎事項をメモした その少し具体化したメモ 調和振動子というのがある。ばねにつながれたおもりが、行ったり来たりするやつが古典力学版 運動エネルギーと、ばねの…
こちら Hereditary breast and ovarian cancer BRCA1 BRCA2 Li-Fraumeni syndrome TP53 Peutz-Jeghers syndeome STK11 Lynch syndrome MLH1 MSH2 MSH6 PMS2 Familial adenomatous polyposis APC MYH-associated polyposis;adenomas, multiple colorectal, FA…
PDF 臨床的に行われたゲノムワイドシークエンシングによって、二次的に・意図せずに見つかる遺伝的ファインディングズの取扱いについて これが書かれた時点(Genetics in Medicine (2014) 17, 68 11;69 )で知見が強いとみなしうる「56 genes」については、患…
2013にAmerican College of Medical Geneticsが出したNGSの臨床利用に関するガイドライン 遅まきながらメモ PDF 構成を書き出すだけでも一苦労ですが… 基本的には留意点の網羅的列挙となっており、実用にあたっては、遺伝学者・臨床家・臨床検査家が注意深く…
こちらで量子力学・行列力学・作用素環についてメモしている 自分のための量子力学としては、確率事象空間における離散性の扱いと量子力学との関係が大事 波動方程式という確率密度分布の時間変化情報 自由粒子というものがある。無限空間に「粒子」があり、…
雑多に広がる確率離散過程に関する話題提供のための構成メモ 主軸はゲノム・遺伝因子 遺伝因子をエピゲノム・トランスクリプトームと絡めるための、スイッチオンオフモデル その確率論的制御 どのようにしてそのような仕組みの歴史的構成が可能かについての…
スイッチのオンオフはスイッチ数pのとき、個の頂点を持つp次元単位格子上の状態推移として考えられる この酔歩にあって、ノードに存在確率の濃淡を作るには、あるノードには、流入しやすいけれど流出しにくい、ということを実現することが必要だ 何がそのよ…
昨日の記事や一昨日の記事に対数正規分布・ポアソン対数正規分布のことをメモした 常染色体上のSTRをPCR増幅をかませた実験によってピークシグナル型データを取得し、それに基づいてDNA型タイピングをするやり方がある そのデータについて、対数正規分布・ポ…
昨日、対数正規分布についてメモした その離散版。ポアソン対数正規分布 こちらのqRT-PCRとか、こちらの細菌検出とかで使われている ポアソン分布のパラメタが対数正規分布に従っているとして計算しているらしい poilogなるパッケージがあって、dpoilog(),rp…
対数正規分布は、supportが正の値をとる連続分布で、生命現象を含む自然現象に広くみられる分布(こちらのFacultyOf1000 Prime)にもあるように Rの対数正規分布に関する関数はdlnorm(),plnorm(),qlnorm(),rlnorm()の一式なのだが、ちょっと使いづらいかもしれ…