オムニバス パーミュテーション解析



  • 使っている論文はこちら(使い方は、ごく一部に思われる)
  • 典拠書籍はこちら(未入手)

    Multivariate Permutation Tests: With Applications in Biostistics

    Multivariate Permutation Tests: With Applications in Biostistics

  • 論文の要旨
    • 複数のSNPs in 複数のloci
    • Correlation between/among SNPs…Linkage disequilibrium (and others)
    • 解析手法例
      • Hotelling's T^2
      • Haplotype block-based analysis
      • Score test
      • Bayesian
      • Global U
      • Curve-fitting for location of markers
    • Omnibus permutation testの特徴
      • 原理上の特徴
        • 複数の関連検定を組み合わせる
        • 複数の関連検定統計量は雑多で構わない
        • 複数の関連検定統計量の各々から得られるp値を用いて、組み合わせ関連検定の"combining fnction"を算出する->"combining function"は後述
        • "combining function"の多寡で観測データのP値を定める
      • 実行上の特徴
        • Permutationalに正確
        • サンプルサイズとその均衡・不均衡について頑健
        • 計算量は多いが、計算自体は単純
    • "combining function"
      • 検定統計量であるために満たすべき条件
        • 組み合わせ解析の統計的有意度について単調減少する
          • この条件を満たすための具体的な条件として挙げられているのは次の通り
            • 各々の関連検定p値について、"combining function"は非増加的である
            • いずれか1つの関連検定pが0のときには、"combining function"は最大となる(最大値は無限大でも構わない->下のFisher's -2 ¥sum log(p_i)は実際そのようになっている
            • いかなる統計的有意度についても、有限な値を持つ
      • "combining function"の例
        • Tippett's max(1-p_i)
        • Fisher's -2¥sum log(p_i)
        • Liptak's ¥sum¥Phi^{-1}¥frac{1-p_i}{¥sqrt n}
      • "combining function"の統計量としての特性
        • Omnibus permutationは組み合わせ検定を構成する個々の検定が相互に独立であるかどうかが不明であるから行うわけであるが、個々の検定が相互に独立であった場合に、上記の"combining function"の例には次のことが知られている
          • Tippett's max(1-p_i)は、nx^{n-1}, x ¥in (0,1)の分布
          • Fisher's -2¥sum log(p_i)は、自由度2nの¥chi ^2分布
          • Liptak's ¥sum¥Phi^{-1}¥frac{1-p_i}{¥sqrt n}は、標準正規分布
    • 個々の検定から出るp値を用いないOmnibus test
      • 個々の検定についてp値でなく、それ以外の値が得られることもある。その値の、帰無仮説での期待値からの逸脱の程度を用いることもある
      • 実例
        • Kolmogorov-Smirnov statisticsを用いたマイクロアレイデータのオムニバステスト
        • Anderson-Darling(A-D) statistic