第3章 1標本パーミュテーションテストの理論



  • 3.1 Introduction
    • 3.1.1 定義など
      • 単一変数Xが、連続量をとるものとする。観測サンプル数nの次元のX^nユークリッド空間を張る。ある『実験』が、要素数nのXの観測データセットをもたらし、そのXは、データセットが張る空間中の点をPermutationで取りうる点として持つ。この個々のデータセットに対応する点が確率密度Pを定義する。データセットが張る空間中の点は、ボレル集合族Borel sets*1となっている。
      • 単一のカテゴリカル変数、多変数について、この定義は追って拡張される
      • 帰無仮説において、単一の確率密度が対応する場合は、simpleな帰無仮説であると言い、複数の確率密度が対応するときには、composite(複合の)帰無仮説であると言う
      • ありとあらゆる、観測データセットのすべての可能性について、空間は張られている。ひとたび、観測データが得られると、それをpermutationして得られる擬似観測データセットのすべてが、部分空間orbit X/¥bf{x}として定まる。帰無仮説においては、(通常)この部分空間上のそれぞれの点に相当する確率は相互に等しい。また、すべての空間は、orbitsの集合であり、orbit同士には、重なりが存在しない
      • 観測データは冗長である。観測データから、ある変換したデータセットを作り出すことを考える。冗長性は排除したいが、情報は失いたくない。第2章の例で、20ペアの観測値YA,YBとその差であるX=YA-YBを考えた。YAとYBをあわせた2x20=40個の数値は、観測データのすべてであり、もちろん、十分な情報量を持っている。しかし、その差Xは20個の値のセットとなっているが、YAとYBとの間に行った介入に関して検定できることからもわかるように、情報は失われていない。情報は減っていないのに、データ量は40から20に半減した。今、20人の異なる個人に対しての観測データから20個の値を得ていることになり、(おそらく)これより少ないデータ数に減らすことは、情報を失うことになるだろう(20人に関して何かしらの情報が得られて、さらにcompressすることを可能にしてくれない限り)。そういう意味で、この20個の値のセットであるXは、最少かつ十分な統計量である。
      • 検定統計量を算出する作業は、観測データから、1次元の数値を得る作業である。今、帰無仮説のもとでサンプルが交換可能な条件を満たしているということは、交換について、その確率分布によらず、不変であるような検定統計量を、不変検定と呼ぶ。サンプルの交換可能性のもとで不変であるということと、サンプルの交換可能性を決める条件に基づいて条件付けするということは、(ほぼ)同じことである。この『不変』と『条件付け』という、同じ内容の2面性のどちらに着目して、permutation testを組むかが、正式な2つのアプローチのそれぞれを特徴づける
      • n個のデータセットから、sufficient statistics*2の最少セットを用いて解析するということと、不変変換を最多回数実施するということは、表裏の関係にあるが、上項の『不変』と『条件付け』との関係はそのような関係にある
    • 3.1.2 0を中央に対象な1変数
      • 中央値が0であり、中央値について対象であるような分布から得られるデータセット¥bf{X}があり、十分であるとき、その絶対値のデータセット|¥bf{X}|も十分である。交換して得られるデータセット¥bf{X^*}も十分である
      • 多変量になると、¥bf{X}¥bf{X^*}とは十分だが、|¥bf{X}|は十分ではない
    • 3.2 パーミュテーションテストにおける統計量の同等性
      • [定義]ある観測を考える。その観測からはデータセットが得られる。得られうるデータセットは『サンプル空間』に分布している。今、このようなサンプル空間の1点に相当する観測データセットから、2つの1次元統計量T_1,T_2を算出するものとする。T_1,T_2が次の条件を満たすときに、両者はパーミュテーション的に同等であるという。
        • どんな観測データセットについても、その観測データセットについても次のことが言えること
          • ある観測データセット¥bf{X}についてT_1(¥bf{X})T_2(¥bf{X})が得られる。¥bf{X}のパーミュテーションデータセット¥bf{X^*}について、T_1(¥bf{X^*})T_2(¥bf{X^*})が得られる。¥bf{X}と、そのすべてのパーミュテーションデータセットについて、T_1(¥bf{X^*}) ¥le T_1(¥bf{X})が成り立つ必要十分条件は、T_2(¥bf{X^*}) ¥le T_2(¥bf{X})が成り立つことである
          • いくつかの言い換えができる
            • あるデータセットが与えられたときに、そのデータセットが作るパーミュテーションデータセットの内部では、統計量T_1,T_2の上下関係に逆転がないこと。また、それがすべてのデータセットについて言えること。
            • 統計量の片方の正負を逆にすることで、増加・減少の関係が逆となるような2つの統計量も存在するが、それらは、逆向きに同等といえる。
            • ある2つの統計量がパーミュテーション的に同等で、そのうちの片方の統計量と第3の統計量が同等であるときには、この3つの統計量はお互いに同等である
  • 3.3 パーミュテーションテストの正式の定義
    • 3.3.1 Randomized Permutation Tests
      • 観測データより、統計量T_oを算出する。ランダムパーミュテーションにより、M個の統計量¥bf{T^*}={T^*_i},i=1,...,Mを算出する。任意の棄却水準¥alpha, 0¥le ¥alpha ¥le 1について、T_{¥alpha}=T_{(M_{¥alpha})}, M_{¥alpha}=¥lfloor (1-¥alpha)¥times M ¥rfloor(整数部分)を定める
      • 棄却水準¥alphaで棄却されるか否か(テスト結果)は、次のように定める
        • T_o ¥gt T_{¥alpha}なら、¥phi_R=1(棄却)
        • T_o = T_{¥alpha}なら、以下で与えられる棄却する確率¥phi_R=¥gammaをテスト結果として与える
        • T_o ¥lt T_{¥alpha}なら、¥phi_R=0(棄却しない)
      • これを式で表すと
        • ¥int_{X|¥bf{x}} ¥phi_R dP_{|¥bf{X}}=E_{X|¥bf{x}}(¥phi_R)=¥alpha
    • 3.3.2 Non-randomized Permutation Tests(全順列しらみつぶし)の場合には、ランダム法の¥gammaの不確定分が消失する
  • 3.4 Permutation Testsに関してよく問われることなど
    • 他のパラメトリックな検定との関係
      • 2章で扱ったように、同一のデータセットについてpermutation testのほかに複数のテストを実行することが可能であるが、それらの検定としての優劣・特性の違い・その由来について
    • Permutation testに用いる統計量の選択
      • ¥sum X_iのような『平均』に類する統計量が用いられることが多いが、その根拠は何か、問題はないのか。
      • 統計量の大きく試行回数の総和がどうして、棄却域に相当するのか、統計量が大きいことは起こりにくいと言い切れるのか。
  • 3.5 1サンプル問題の諸例
    • 例1 対象性のテスト
      • 0を中心とした対象性テストは2章の例の通り。再掲すると:
        • 順列総数はM=2^n
        • T=¥sum_i X_i
        • 代替
          • K=¥frac{¥sum_i X_i}{¥sqrt{¥sum_i X_i^2}}
      • ある値¥deltaを中心とした対象性テストは
        • T=¥sum_i (X_i-¥delta )もしくはK=¥frac{¥sum_i (X_i-¥delta )}{¥sqrt{¥sum_i (X_i-¥delta )^2}}
    • 例2 2変数の独立性のテスト
      • 順列総数はM=n!(2変数の片方の序数だけを順列入れ替えする)、2変数でなくて、q変数になると、M=(n!)^{q-1}のように、全部の変数で順列を独立に入れ替えてやる必要が出ることに留意
      • T=¥sum_i X_i Y_i,T^*=¥sum_i X_i Y_{u_i^*}
    • 例3 データ系列のどこかにフェーズの変わる点があるかどうかのテスト
      • 同一のサンプル空間にあるデータ系列があり、それらは、いずれも同一の分布を持っている(帰無仮説)に対して、前半と後に分ける点がどこだかわからないけれども存在して、その前後で異なる2分布から得られた(対立仮説)をテストする
      • 観測データセットの場合も、パーミュテーションデータセットの場合も、『もしかしたら存在するかもしれない前後に分ける点』としてもっともありそうな点を1¥le i ¥le nだけ探索し、その『もっともありそうな分離点』についての統計量に関して、パーミュテーション統計量系列における、実観測データの統計量の相対的位置からテスト結果を与える
      • T^*=max_{1¥le i¥le n} ¥frac{(¥frac{i}{n}W_n-W_i^*)^2}{(i(n-i))}
      • W_i=¥sum_{k=1}^i X_k
    • 例4 交換可能性のテスト
      • q変数、nサンプルのデータセット¥bf{X} = ((X_{11},X_{21},...,X_{q1}),(X_{12},X_{22},...,X_{q2}),...,(X_{1n},...,X_{qn}))については、M=(n!)^qのパーミュテーションが存在し、一般的に
      • T=¥sqrt{n} sup_{A¥in ¥bf{A}} |P(A)-X(P(A))| なる統計量がある。ただし、¥bf{A}は"a suitable non-empty collection of events"である
  • 3.6 その他のパーミュテーションテストに関すること
    • 3.6.1 p値
      • ある観測データセットについて、帰無仮説にもとづいたパーミュテーションデータセットがとる部分空間において、帰無仮説の下での統計量は、均一の確率分布で存在するが、対立仮説の下での統計量は、非均一に分布する。その逆も然りで、ある対立仮説にもとづいたパーミュテーションデータセットがとる部分空間において、対立仮説の下での統計量は、均一の確率分布で存在するが、帰無仮説の下での問う軽量は、非均一に分布する。
      • 帰無仮説(¥delta =0のときと、対立仮説¥delta ¥not = 0のときとで、パーミュテーションp値は変化するが、¥delta ¥gt 0 で、X_i(¥delta ) = X_i(0) + ¥deltaのときには、p値は¥delta =0のときより小さくなる。たとえば、2章のデータに準じる例だと、¥deltaを適当に振ると、こちらのグラフのようになる。X=YA-YBのときは、X>0の関係があるデータであり、X=YB-YAとした場合には、X<0が真の関係である。それに応じて、X=YA−YBのときには、帰無仮説においてP値が0.27程度、X=YB-YAでは0.77となっている。いずれも、¥delta ¥gt 0ではp値がより小さく、¥delta ¥lt 0ではp値がより大きくなっている
    • 3.6.2 Conditional and Unconditionalなこと
      • Conditional power Function
        • W_{¥alpha}(¥bf{X}(¥delta))=¥bf{E}_{X|¥bf{x}}(I¥{¥lambda (¥bf{X}^*(¥delta ) ¥le ¥alpha |¥bf{X}(¥delta)¥})=Pr(T(¥bf{X}(¥delta)) ¥ge T_{¥alpha}(¥bf{X}(¥delta))|¥bf{X}(¥delta))
      • 帰無仮説においては、統計量の分布は、観測データセットによらない確率分布になる
      • 帰無仮説、弱い寄与を認める対立仮説、強い寄与を認める対立仮説の順に、同じ¥alphaのパーミュテーションデータセットが生じる確率は高くなる。これも観測データセットによらない
  • 関連項目:
    • ¥sigma -additive*3
    • invariant *4
    • Behrens-Fisher problem*5
    • Lebesgue measure*6


*1:Borel setsこちら

*2:sufficent statistcs こちら

*3¥sigma -additiveこちら

*4:invariant : transformationされても変化しないこと、不変 こちらの記事など

*5:Behrens-Fisher problem こちらの記事など

*6:Lebesgue measure こちら