Permutationテスト



  • 統計学の2つの作業
    • 集計
    • 推定・検定
  • 集計がすること
    • 多数のデータの指標を定め、指標を算出する
  • 推定・検定
    • 多数のデータから母集団の指標の確からしさをP値で表現すること(もしくは、集団の比較の場合には、母集団指標間の違いの確からしさをP値で表現すること)
  • P値
    • P値を理解するにあたり、ただひとつの方法を会得することにするとすれば、それは、Permutationテストを理解することがベストであろう
  • Permutationテストとは
    • ある指標を定め、観測データからその指標を計算する
    • 観測データについて、サンプルをランダムに交換することによって、その指標を繰り返し計算し、その指標の値の分布を得る
    • 観測データで得られた指標値が、その指標の値の分布において、どれくらいおきやすいか・おきにくいかをパーセンタイルで表したとき、その値がP値に相当する
    • たとえば、2x2分割表の場合、カイ自乗値を得て、それを、カイ自乗分布におけるP値にすることと、カイ自乗分布をPermutation テストでP値化することは、ほぼ同じ。Permutation テストの場合には、2x2分割表のセルごとの数値による適用制限を考慮しなくてよいという利点もある。
    • 2x2分割表からは、オッズ比も計算できる。得られるオッズ比(とその逆数のうちの大きい方の値)についてPermutationテストを実施することにより、1からずれたオッズ比がどれくらいおきにくい値かはP値化できる。
    • Permutationテストでは、カイ自乗値におけるPermutationテストのP値もオッズ比におけるPermutation テストのP値も同一になる。これは、カイ自乗値とオッズ比値とが1対1対応の関係にある統計量であるからである。