de novo 変異の検定

  • こちら("Exome sequencing supports a de novo mutational paradigm for schizophrenia")の論文では、表現型に「機能性の予想される」「de novo 変異」をエクソーム・シークエンスで探している
  • de novo と思われる変異をシークエンシングで見つけて
  • その変異にスコアを与えて(スコア化の色々について)
  • スコアの分布が2群間で異なるかどうかを検定している
  • その検定の構造
    • まずは、「値」与える
      • 進化の歴史に照らす
        • phyloP
        • Rでは以下のパッケージの関数phyloP()がそうか?
library(rphast)
help(phyloP)
      • アミノ酸置換の過激度に照らす
        • Grantham dissimilarity score(こちらが元文献)
      • Kolmogorov-Smirnov検定(Wiki こちら)
        • 観測値から経験分布を作り、それについて差異を検定
        • Rではkv.test()
x <- rnorm(50)
y <- runif(30)
# Do x and y come from the same distribution?
ks.test(x, y)
# Does x come from a shifted gamma distribution with shape 3 and rate 2?
ks.test(x+2, "pgamma", 3, 2) # two-sided, exact
ks.test(x+2, "pgamma", 3, 2, exact = FALSE)
ks.test(x+2, "pgamma", 3, 2, alternative = "gr")

# test if x is stochastically larger than x2
x2 <- rnorm(50, -1)
plot(ecdf(x), xlim=range(c(x, x2)))
plot(ecdf(x2), add=TRUE, lty="dashed")
t.test(x, x2, alternative="g")
wilcox.test(x, x2, alternative="g")
ks.test(x, x2, alternative="l")