コルモゴロフ=スミルノフ

累積確率分布の「開き」の大きさ

Gene-set enrichment analysisの一環としてこちらでコルモゴロフ=スミルノフ検定(KS検定)の話がちらっと出た KS検定は1標本と2標本の区別がある 観察された標本の元の分布が、ある特定の分布ではない、と考えた方がよいかを判断する(1標本のKS検定) もし…

コルモゴロフ=スミルノフ統計量おまけ(連検定)

こちらにもあるように。 2標本が同一母集団から取られているとすると、それらを併せて順序をつけると、第1群、第2群としたときに1,2,2,1,1,1,1,1,2,2,1,2,2,みたいな1,2の数値列ができるけれど、この1,2がばらばらなのか、という検定をすることでも検定可…

コルモゴロフ=スミルノフ統計量その3(ブラウン・ブリッジ)

累積分布の比較には特徴がある スタートは0でゴールは1。必ず そのため、二つの累積分布の差を見るとき、スタートが0でゴールも0になる 経験分布2つ(もしくは経験分布と理論分布との2つ)の差を取ると、「0で始まって0で終わる」 横軸は「0で始まって1で終…

コルモゴロフ=スミルノフ統計量その2(母分布に依存しない)

前の記事では、正規分布と指数分布との混合の場合をやった x.norm(n) x.exp(n) の混成だった。ソートしてプロットすれば、完全になめらかとは言わないが、一峰性 そこで、二峰性にしてみよう x.norm(n,-10) x.exp(n) の混成に。図にすれば、こう いわゆる密…

コルモゴロフ=スミルノフ統計量その1(0に概収束する)

まず、Rのks.test()関数の中身をぱくって、2標本の場合のks.test()統計量の算出のところだけを抜き出した関数を作っておこう my.ks.stat <- function(x,y,type=c("less","greater","two.sided")){ n.x <- length(x) n.y <- length(y) w <- c(x, y) z <- cum…