2013-01-01から1ヶ月間の記事一覧

ゲノム疫学解析が伸ばす触手

GWASでほとんど成果の上がっていない病的過程について考える その病的過程はエンティティとしての疾患の一部という意味で「サブ・最終フェノタイプ」 その「サブ・最終フェノタイプ」は最終フェノタイプとしての疾患x複数に共有されている このようなサブ・…

モデリングの気持ちをAIXI的実習でやってみる

こちらにAIXIの話 それに関するディスカッションがこちら 京大ジュニアキャンパスで?医学部4回生の講義で? 「自分が他人とインターラクティブに勝負をしているとき」を実験的にやってみる そこからスタートしてモデルを考える、とはどういうことか、とか …

比のゲノムワイド解析・MaxQuant

プレゼンスライド(こちら) Global analysis of genome, transcriptome and proteome reveals the response to aneuploidy in human cells 特殊な条件(aneuploidyなセルライン)にて3オミックス層の実験データを突き合わせてみる 用語 Aneuploidy 実験 Genomi…

単純なルールを予測する

統計学やデータ解析ではモデルを単純にしよう、という大前提を使う。「オッカムの剃刀」。これは、モデルの過適合を避けよう、という意図に通じている 統計学・データ解析によらず、原則、「オッカムの剃刀」で行こうよ、という立場は強く、それが「物理の法…

ドラえもんのポケット

昨日は「責任」がキーワードだった ブログだから、「責任」よりは「ドラえもんのポケット」の方がよいかもしれない 『ドラえもんのポケット』: "...キジマさんが心を動かされた瞬間がわかるのです。「あ、いいな」と思ったものを、その瞬間にコレクションし…

責任

こちらで「専門家」について書いている 書いたもののうち、その書きものの中で合理的に納得いかせられないけれども、その書きものを読んで納得する必要のあるものはreferenceを引いておくこと、というルールでreferenceは引いてある。 なので、referenceと言…

二次的現象なのか

特定の要因がなくても発生する事象があって、ある要因があるとその事象が引き起こされるような印象がある。その印象はどんなときにどのくらいもたらされる? 印象を強める要素は何だろう? N<-20 # 単位期間にDという有害事象が起きる確率 pD<-0.1 D<-runif(…

大小不同の瞬発力

貧血における赤血球の大小不同や悪性細胞の大小不同の定量の瞬発力 癌の細胞診(参考) # 一視野あたりの細胞数 n.cell <- 10 # 半径の平均はすべてのスライドでそろえよう r.mean <- 1 # 結構ばらばらな2x2分割表を作る library(MCMCpack) library(shape) …

放っておけば相乗的

my.2x2.dev <- function(p,q,r){ #tmp <- r*sqrt(p*q*(1-p)*(1-q)) x <- c(p*q,p*(1-q),(1-p)*q,(1-p)*(1-q)) tmp <- r*min(x) matrix(x+c(tmp,-tmp,-tmp,tmp),byrow=TRUE,2,2) } my.2x2x2.dev <- function(p,q,r){ tmp <- r*sqrt(prod(p)*prod(q)*r) tmp1 <…

あとだしじゃんけんを見破る

グリコを赤・黒の2人でやっている 赤が後だししているかもしれない ただし、赤は後だしをするゲームとしないゲームを分けている しかも、赤はいつも後だしをするわけではなく、何度かに1度だけ後だしをしているらしい 10回、グリコを繰り返して記録をつけ…

密度分布と累積密度分布を結びつける

n <- list() x <- list() k <- 3 library(MCMCpack) for(i in 1:k){ n[[i]] <- rdirichlet(1,rep(0.1,3))*1000 x[[i]] <- runif(n[[i]][1]) x[[i]] <- c(x[[i]],rnorm(n[[i]][2],0.5)) x[[i]] <- c(x[[i]],rexp(n[[i]][3])) } par(mfcol=c(2,k)) s <- sample…

2x2表:ぱっと見て感じる

2x2分割表のクイズ 実行すると、2x2表に対応する棒グラフがいくつか並べて提示される 図を先送りすると、そのフィッシャーの正確確率検定p値が表示され、最小p値の棒グラフがハイライトされることで、答え合わせができる Q『次の3つの棒グラフに対応…

瞬発力クイズ

確率分布

ikuro's homepageさん で確率分布・各論のシリーズ記事が出ています。 その1:確率分布関数の分類、左右対称の連続確率分布(正規分布) その2:左右対称の連続確率分布(続き)(コーシー分布、t分布、ロジスティック分布、ラプラス分布) その3:正にゆがんだ…

発現データの指標

こちらの2013/01/18の記事で次世代シークエンサーを用いた発現量解析の話がある。量的指標としてRPKMについて言及している RPKM Reads Per Kirobase per Million mapped reads こちら 関連して。RPKMとAverage normalized abundanceとその比較 こちら 指標は…

SimRare

こちらの2013/01/15の記事でSimRareを用いたシミュレーション・解析手法比較の実習をやっている SimRare(文献)ではどんなモデルを想定してバリエーションを生成しているのだろうか こちらがSimRareのサイト チュートリアルの"Generation of variant data(こ…

微量混合試料

こちらの勉強会(2013/01/12)で紹介されたプログラム LRmix likeLTD

色覚バリアフリー

色覚には遺伝子が関係します Geneticsはこちらを プレゼンテーションの心得としてはこちらの中でも、「医学生物学者」向けのこちらを理解したいものです Rではパッケージ dichromat というのがあって install.packages("dichromat") library(dichromat) imag…

色覚バリアフリー

GWASのステップ

JMP genomicsソフトウェアのマニュアル記事が使いやすい こちらがマニュアル あえてリストを抜き出せば *Check Data Contents *Verify Gender of Samples *Subset and Reorder Genetic Data *Recode Genotypes *Recode Missing Genotypes *Flip Strand *SNP …

DNA鑑定のために

STRbase(Short Tandem Repeat DNA Internet DataBase:STR関係データベース) Standard Reference Family Data:A Tool for Validating Kinship Analysis Software

Statistical model

Wiki記事:パラメトリックとノン・パラメトリックの違いをパラメタ次元の有限性と無限性とで定義 Paper in Annals of Statistics:代数的定義 代数統計学では代数多様体とする

累積確率分布の「開き」の大きさ

Gene-set enrichment analysisの一環としてこちらでコルモゴロフ=スミルノフ検定(KS検定)の話がちらっと出た KS検定は1標本と2標本の区別がある 観察された標本の元の分布が、ある特定の分布ではない、と考えた方がよいかを判断する(1標本のKS検定) もし…

コルモゴロフ=スミルノフ統計量おまけ(連検定)

こちらにもあるように。 2標本が同一母集団から取られているとすると、それらを併せて順序をつけると、第1群、第2群としたときに1,2,2,1,1,1,1,1,2,2,1,2,2,みたいな1,2の数値列ができるけれど、この1,2がばらばらなのか、という検定をすることでも検定可…

コルモゴロフ=スミルノフ統計量その3(ブラウン・ブリッジ)

累積分布の比較には特徴がある スタートは0でゴールは1。必ず そのため、二つの累積分布の差を見るとき、スタートが0でゴールも0になる 経験分布2つ(もしくは経験分布と理論分布との2つ)の差を取ると、「0で始まって0で終わる」 横軸は「0で始まって1で終…

コルモゴロフ=スミルノフ統計量その2(母分布に依存しない)

前の記事では、正規分布と指数分布との混合の場合をやった x.norm(n) x.exp(n) の混成だった。ソートしてプロットすれば、完全になめらかとは言わないが、一峰性 そこで、二峰性にしてみよう x.norm(n,-10) x.exp(n) の混成に。図にすれば、こう いわゆる密…

コルモゴロフ=スミルノフ統計量その1(0に概収束する)

まず、Rのks.test()関数の中身をぱくって、2標本の場合のks.test()統計量の算出のところだけを抜き出した関数を作っておこう my.ks.stat <- function(x,y,type=c("less","greater","two.sided")){ n.x <- length(x) n.y <- length(y) w <- c(x, y) z <- cum…

経験分布関数とコルモゴロフ=スミルノフ検定

代数多様体上の酔歩

代数多様体っていうのはカオス理論で言うところのアトラクタ(参考)みたいなものらしい(こちら) アトラクタの上で決定論的な動きを考えれば、ベクトル場を想定すればよい アトラクタの上で確率的な動きを考えれば、基本的には1歩ずつの酔歩の合成で考えれば…

分割表を代数統計する

2x2表をSingular でやってみよう x+y=p1,z+w=p2,x+z=q1,y+w=q2とする(p1,p2,q1,q2が周辺度数) ring p = 0,(p1,p2,q1,q2),lp; ring x = 0,(x,y,z,w),lp; setring p; map f = x,p1*q1,p1*q2,p2*q1,p2*q2; ideal i0 = 0; setring x; preimage(p,f,i0); これは前…