第5章 多標本パーミュテーションテストの理論



  • 5.1 基本事項の復習
    • パーミュテーションテストでは、全パーミュテーションを調べる場合と、モンテカルロで分布を作る場合とがある。前者では、観測データの正確なパーセンタイルがでる。後者では推定分布がでる。棄却水準を考えるとき、前者では、棄却水準を与える統計量以上の統計量が観測データから得られている場合には、棄却し、そうでないときは棄却しない。他方、後者では、観測データ統計量が棄却水準統計量と等しい場合には、棄却するかしないかは確率的に決まる。
  • 5.2 多標本パーミュテーションで検定するいろいろ(第4章であつかったものを列挙、整理)
    • 2群の平均値を比較
      • ¥bar{X_j}=¥frac{¥sum_i X_{ij}}{n_j}』もしくはT = ¥sum_i X_{1i}
    • One-way ANOVA
      • S¥sum_{j=1}^C(¥bar{Y_j}-¥bar{Y_{all}})^2¥times n_j
    • Goodness Of Fit (分割表)
      • グループ数C ¥ge 2で序列のあるカテゴリカル変数の場合
        • T_{AD}=¥sum_{j=1}^{C}¥sum_{i=1}^{k-1}(F_{ji}-¥bar{F_i})^2¥times (¥bar{F_i}(1-¥bar{F_i})¥frac{n-n_j}{n_j})^{-1}、ただし、F_jiは、グループjにおけるカテゴリ1-i累積人数の割合。¥bar{F_i}=¥frac{N_{.i}}{n}N_{.i}=¥sum_j N_{ji}
      • グループ数C ¥ge 2で序列のないカテゴリカル変数の場合
        • T_{AD}=¥sum_{j=1}^{C}¥sum_{i=1}^{k}(¥frac{f_{ji}}{n_j}-¥frac{f_{.i}}{n})^2¥times (f_{.i}(n-f_{.i})¥frac{n-n_j}{n_j})^{-1}
    • Two-way ANOVAのフレーム
      • 一般的なTwo-way ANOVAの例は第4章で扱っていないが、2次元行列で表せるデータがあり、それぞれの次元は変数系列に相当する。どちらの変数系列もデータに影響がないし、変数系列の組み合わせも影響がない、というのが帰無仮説
      • 2つの変数系列のうち、片方については検討を要しないようなデータの場合には、状況は簡単になり、興味のない方の変数系列についての見当も、2変数の組み合わせについての見当も不要になる。
      • さらに、興味ある片方の変数系列の個々のデータが交換可能であるとき、状況はさらに単純化する。この場合は、第4章で扱った
        • T_R=¥frac{¥sum_{j=1}^k(¥bar{X_{j.}}-¥bar{X_{..}})^2}{¥sum_{j=1}^k¥sum_{i=1}^n (X_{ji}-¥bar{X_{.i}}-¥bar{X_{j.}}-¥bar{X_{..}})^2}
  • 5.3 推定量の不偏性と検定力
    • 検定の例のいくつかについて、パーミュテーション統計量の不偏性について論じている。推定量にバイアスがあるかないか(不偏か)は検定力との関係で、論じるべきなので、その点についての記載がある。普遍性と検定力とについてのコメントはこちらのWikipedia記事などで。
    • 誤差項はサンプルサイズが大きくなるにつれ正規分布近似される
    • 定量の不偏性については、モンテカルロ実験にて確認された、とある
    • 帰無仮説の棄却に続き、対立仮説(¥delta ¥not =0)のうち、¥delta_{MaxL}の推定に関する考察がある。基本的に、観測データと統計量とから、¥deltaを変数とした尤度分布が得られ、¥delta最尤推定値を求めるのが、その作業となる
  • 5.4 漸近性
  • 5.5 パーミュテーションの中心極限定理