R

医科学のためのデータシミュレーション 2

R

こちらの続き 医学・生物学データの扱いに慣れるための、データシミュレーションセミナーの資料(医学研究科大学院コース ゲノム遺伝学@京大 2014:こちら) htmlファイルはこちら(Login as a guest でログインすると見られます) こちらを参考にすればhtml化可…

医科学のためのデータシミュレーション、のための予備知識 補遺

R

こちらの続き 医学・生物学データの扱いに慣れるための、データシミュレーションセミナーの資料(医学研究科大学院コース ゲノム遺伝学@京大 2014:こちら) htmlファイルはこちら(Login as a guest でログインすると見られます) こちらを参考にすればhtml化可…

医科学のためのデータシミュレーション 1、のための予備知識

R

医学・生物学データの扱いに慣れるために、データシミュレーションを中心に行うセミナーをするとして(医学研究科大学院コース ゲノム遺伝学@京大 2014:こちら)、それに参加するための最少要求内容のRmd htmlファイルはこちら(Login as a guest でログインす…

『わたしのためのJames-Stein Estimator』

こちらでGaussian estimation: Sequence and wavelet modelsのおさらいをしようとしている その手前で「複数(たくさん)の観察がなされたときに、それらを一括してデータマイニングする」一つの方法としてJames-Stein Estimatorが出てくる Gaussian Estimatio…

イベント集積に関するメモ

n <- 1000 # ランダムに脱落する prob <- c(0.5,0.5) censor <- sample(0:1,n,replace=TRUE,prob=prob) # 指数乱数で死亡時刻が決まる #times <- cumsum(rexp(n)) times <- sort(rexp(n)) x <- ((n-1):0)/(n:1) v <- rep(1,length(x)) v[which(censor == 1)] …

Circular a posteriori projection

いくつかの基準カテゴリがあって、それらに遠近関係があるという。多次元だと視覚化しにくいので、2次元のしかも円周上に配置する。その上で、たくさんあるその他もろもろの点を、その基準カテゴリに帰属する「割合」を基に、その2次元円内にプロットする…

RNAseqのためのDownsampling

Downsamplingはそれなりに数のある標本から、標本数を減らしてリサンプリングする作業のこと RNAseqのデータにおいて、複数の細胞からの1細胞RNAseqのデータを相互比較したりするときに、ダウンサンプリングした方がよい、という話が、こちらの論文にあった…

遺伝因子推定

BRCAPROは乳癌・卵巣癌の遺伝的リスクを計算するアプリケーション(こちら) その他疾患拡張として大腸直腸癌・子宮内膜癌の遺伝的リスクを推定するアプリケーションがCRCAPRO(論文へのリンク) さらに膵癌がPancPRO 基本的には仕組みは同じなので、疾患や条件…

S.A.G.E.で分離比解析

S.A.G.E.のsegregを使って分離比解析に初めて挑戦するための解説文書 講義90分で1-2回分相当 アプリケーションはこちら(S.A.G.E) 分離比解析ができる 分厚いマニュアルもあるが、たくさんのことができるので分離比解析に関する章となるとそれほど親切ではな…

S.A.G.E.の分離比解析サンプルデータ

実行条件パラメタデータ family ind father mother sex generation affection risk genetic_risk locus_risk_1 locus_risk_2 locus_risk_3 genotype_1 genotype_2 genotype_3 1 111 97 106 -1 9 1 1003 1003 1001 1 1 0/1 1/1 1/1 1 97 93 96 1 8 0 3 3 1 1 …

分離比解析をS.A.G.E.で

分離比解析に関連して家系データの作り方や家系図描図について書いた(昨日など そこで作った家系データをS.A.G.E.のsegregという分離比解析アプリにつなごうと思う 分離比解析のための基礎知識 分離比解析でやること 家系で0/1のフェノタイプ情報を集める(今…

少し真面目に家系図と家系データ

分離比解析をやっている たくさんの家系データを作りたい 昨日の記事でグラフの成長ルールで家系を作る話を『なんちゃって家系図』として書いた 遺伝リスクやリスクアレルの伝達も含めて、少しきちんと作ってみる 設定 家系データの作り方 家系図を以下の要…

なんちゃって家系図と家系データ

分離比解析をやっている たくさんの家系データを作りたい 結構面倒くさい グラフではなくて家系図的にすれば n.init <- 1 trio <- matrix(0,n.init,5) m <- length(trio[1,]) trio[1,1] <- 1 trio[1:n.init,4] <- sample(c(-1,1),n.init,replace=TRUE) trio[…

マルチプルテスティングとFDR〜オミックス統計学入門2014

2014年度講義資料 FDRとマルチプルテスティング 90分で1-2回分相当 Rmdファイルです。html化、epub化できます(やり方はこちら) html化、epub化が面倒くさければ、kindleで1米ドルでも(こちら) マルチプルテスティングとFDR?オミックス統計学2014_4? 統計遺伝…

Kernel ROC multi-dimension

ROC ks R

メモ

Isotonic Regressionと半順序

n次元空間に点が散在しているとする この点にはスカラー値が観察されている このスカラー値は、n次元空間に面をなすスカラー値の分布の観察値である 観測点における、スカラー値の大小関係がわかっているものがあるときに、その大小関係制約を入れて、推定値…

診断尤度比、ROC、ロジスティック回帰

2群の値分布が正規分布に従い、その正規分布の分散が等しい場合。2群は黒群が少なめ 左上の図は、2群の確率密度分布。カーブ下面積は、群の比率になる 中上の図は、値ごとに2群の比率考慮の確率密度から、赤・黒それぞれの相対確率(相対尤度)を計算して…

たくさんであることを利用する(HWE・集団構造化・FDR)〜オミックス統計学入門2014

R

集団構造化・民族差・HWEはゲノム疫学データの読み取りに必要になる知識だが、オッズ比の解釈等とはちょっと違って、論文を読む限り、査読の段階できちんとやっていてくれれば、読者はスルーしても(おおまかには)大丈夫 それとは違って大量に対立仮説=真…

次世代シークエンサーを使ったデータ解析〜オミックス統計学入門2014

ひとまず、次世代データ、Deep sequencing データの資料はこんなもの 「こうすれば、よい」という段階ではないので、コンセプト説明が重くなり、また、いざというときの汎用性重視になった…結局、「入門」としては役に立てにくいのだが… まだ、1度も講義使用…

Distance Cartogram

Distance Cartogramのことが気になった ある標本セットについて2つの距離空間情報があったときに、片方の距離空間情報で描かれている地図をもう片方の距離空間の情報で歪ませる、という話。 たとえば、個体の物理的存在位置が一つ目の距離空間で、個体の遺…

DNA二重らせんの高次畳みこみ

R

昨日の記事で高次らせんを描いた これを一昨日の記事のDNA2重らせんと組み合わせると… library(rgl) # 基本的には高次らせん ori <- c(0,0,0) # 第i円の半径。DNA2重らせんの円周は10オングストロームに合わせ、Rsの最終要素の値は10 Rs <- c(640,160,40,1…

らせん

昨日はDNA二重らせんを描いてみた 3次元空間におけるらせんについて少し考えてみる 結果としてこんな絵ができる DNAは2重らせんを作った上で、さらに高次構造を作っている。ヒストンとのタンパク複合体を作ったり、とその現実界的折りたたみ構造についてわ…

DNA2重らせんを使ってknitrに慣れる

knitrを使ってR Markdown文書の扱いを練習している。 DNA2重らせんを描いていみよう 電子書籍化してみました DNA二重らせんをRで描く 数理・統計・計算機作者: ryamada発売日: 2013/12/30メディア: Kindle版この商品を含むブログ (1件) を見る library(rgl)…

Rから気軽にhtml文書やepub文書を作ってみる

ごちゃごちゃ調べて以下、Rstudioで作ってみました これを"hoge.Rmd"として保存して、Rstudioで開いてknit HTMLボタンでhtml文書化して、その後pandocでepub化してみました。 こちらにも書いた通り、epubビューアによって、うまく表示できない場合も少なくな…

ぱらぱらめくる『Nonparametric Regression』

資料はこちらの"Nonparametric Regression〜Appendix to An R an S-PLUS Comparison to Applied Regression" 1. Nonparametric Regression Models 一般型から始めよう k次元空間での回帰を考える パラメトリックな回帰モデルでは、という関数があると想定し…

検定 ぱらぱらめくる『Nonparametric Regression』

前の記事で自由度のこととか出てきた。複雑なモデルにしてフィッティングをよくするか、単純なモデルでフィッティングを犠牲にするかはいつも問題になる。問題になるということは、基準がある。検定もできる 1次元データでやってみる データを作る n <- 100…

ノンパラメトリック回帰

ここのところ、James-Stein推定とか、Shrinkageとか、スプラインとかをいじっていて(こちら)、それらの根は同じなのだが、たとえば、ggplot2の回帰曲線なんかも同じ枠組みらしい Local (polynomial) regressionで、その中で、「近傍」をk-nearest neighborで…

ウェーブレット変換〜WaveThreshパッケージを使ってみる

Wavelet Methods in Statistics with R (Use R!)作者: Guy Nason出版社/メーカー: Springer発売日: 2008/08/11メディア: ペーパーバック クリック: 2回この商品を含むブログを見る 離散ウェーブレット。シグナルベクトルの長さは2のべき乗 library("WaveThre…

分布推定

ここ数日は方向推定の話が続いている 次元空間にのスカラーの分布があるときの推定や図示はカーネル分布推定・ヒストグラム 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのスカラーの分布があるときの推定も同様 次元空間にのベクトルの分…

グラフから「交通の要所」を絵にする

ちょっと退屈しのぎ 一端グラフが出来上がったら、「大事なノード」と「大事なエッジ」は、すべてのノード間の最短パスがどれくらい使うか、で評価してもよさそう 点クラウドからドロネー図を作り、そのグラフでそんな「要所」評価をしてみます この後、エッ…