第4章(3)Goodness-of-fit (分割表検定) 多標本1変数順序のあるカテゴリカル変数のパーミュテーションテストの例



  • 4.4.1
  • 分割表は、そのままだと、パーミュテーション処理に向かないので、unit-by-unit(1サンプルずつ)が帰属カテゴリを持つようなデータにしたうえで、サンプルについてモンテカルロパーミュテーション処理をする
  • 4.4.2 スコアづけによる検定
  • カテゴリには順序があるので、個々のカテゴリに値を与える
  • 量的変数データのときに、個々のサンプルのデータに順位をつける解析(Mann-Whitney)は、サンプルごとに異なるカテゴリを与え、そのカテゴリに差1の値を付与したこととみなせる。ただし、分割表検定では、同点サンプルが多数ある点が量的変数データのランクづけと異なる点である
  • 統計量はT_w = ¥sum_{i ¥in Group1} wi。これは、¥sum_{i ¥in Group1} wi - ¥sum_{i ¥in Group2} wiとpermutationally eqivalent である (それを示すプロットはこちら)。それを算出するソースは末尾
  • 4.4.3 典型的なGoodness-of-Fit テスト
    • 前項で与えたカテゴリ値は、唐突な感じをぬぐえない。観測データに即して、カテゴリ値を調整してみた統計量が教科書に提示されており、さらにそのpermutational equivalenceが示されている。
    • 前項のカテゴリ値の与え方で問題となるのは、次のような例を考えるとわかりやすい。
      • 2群に3カテゴリがある。{5,10,5},{10,10,10}なる観測データだったとする。3カテゴリにそれぞれ、1,2,3の値を与えたとき、¥sum_{i ¥in Group1} wi - ¥sum_{i ¥in Group2} wiは10となる。この統計量が10となるパーミュテーションデータには、{1,18,11},{14,2,14} もあれば、{2,16,12},{13,4,13}もあり、このように等しい統計量をもたらすデータセットが数多く存在してくる。これらを同じ統計量に相当するとみなすことが妥当でない危険が高い。
    • 次の統計量は、観測度数から、カテゴリに与える値を調整している。その数式表現は次の通り
      • T_D = ¥sum_i (N_{2i}-N_{1i}) ¥times (4(¥frac{N_{.i}}{n})(¥frac{n-N_{.i}}{n})(¥frac{n_1n_2}{n-1}))^{-¥frac{1}{2}}
      • ここで、N_{2i}は、グループ2のk=1,2,...,iまでの累積観測度数。N_{.i}は2グループについての累積観測度数の和。nは総サンプル数。n_1はグループ1のサンプル数となっている。
      • この式だと、前項で、各カテゴリに値を与えた式と形が異なるのでわかりにくい。この式を変形すると、各カテゴリiには、カテゴリ数kについて¥sum_{j=i}-k (4(¥frac{N_{.j}}{n})(¥frac{n-N_{.j}}{n})(¥frac{n_1n_2}{n-1}))^{-¥frac{1}{2}}を与えたことになっている。(¥frac{N_{.j}}{n})(¥frac{n-N_{.j}}{n})の項は、カテゴリ順行でのサンプルの増え方と逆行でのサンプルの増え方の両方を加味して、サンプル全体がカテゴリについて均一か否かに対応する調整項である。¥frac{n_1n_2}{n-1}の項は、グループ1とグループ2とのサンプル数の違いについての調整項である
      • 前項でもpermutational equivalentとして簡易な統計量を示したが、こちらにも同様に簡易統計量が存在する
        • T_D=¥sum_i^{k-1} N_{2i} (N_{.i} ¥times (n-N_{.i}))^{-¥frac{1}{2}
      • カテゴリ値に単純な値1,2,3などを与えた場合と、観測データ準拠のカテゴリ値を与えた場合とでは、パーミュテーション統計量の大小に逆転はおきないが、単純なカテゴリ値の場合に同点例が多発してくることを図示したのが、掲載図および、こちらの図
  • 4.4.5 カテゴリに序列がない場合と、グループが3以上の場合への拡張
    • グループが2個でカテゴリに順序があるときには、カテゴリの値は、1つの尺度で比較可能であったので、その差のみを数量化すればよく、また、グループ同士の比較も、1次元の比較であるので、その差を数量化すればよかった
    • カテゴリに順序がなくなると、おのおののカテゴリについて、数値化し、最終的にすべてのカテゴリで合算する必要がある。これは、カテゴリ数の次元を持つ空間について、個々のカテゴリが表す次元における値を定量し、それを合算することになり、これをカテゴリ数空間内の距離と考えてよい
    • カテゴリ数が2であり、片側検定するときには、カテゴリに本来、大小関係になくても、ダミー変数を用いて1次元的に取り扱うことができる。カテゴリ数が3以上になるとそれができなくなる
    • グループ数が3以上に増えることも、グループが作る次元が多次元となる点は、カテゴリの多次元化と同様である。
    • それを反映して、カテゴリ数もしくはグループ数が3以上にも対応した統計量は、観測度数の自乗によって、表現されている。
    • また、グループ数が3以上のときのカテゴリが順序がないときと、あるときとでは、カテゴリ別の観測度数をそのまま用いるか、累積観測度数を用いるかの違いがあることもわかる。カテゴリに順序があるとき、その順序情報は観測度数を累積すること・カテゴリに与える値に累積観測度数を用いた値を適用することで、順序情報を取り込んでいる。逆に、カテゴリに順序がないときは、累積しない観測度数を用いていることも式からわかる
    • 順序のないカテゴリカル変数の分割表データに対する統計量としては、Pearson's chi square を含め、複数存在するが、順序のある場合には、適用できない。順序のあるカテゴリの分割表検定統計量については、こちらの記事も参考に。
    • 順序のないカテゴリカル変数におけるカイ自乗統計量と以下で示す、T^2_{fAD}とは、相関はあるが、permutationally equivalent ではないことに注意。それを示すプロットはこちら。それをエクセルで確かめるためのファイルはこちら
      • グループ数C ¥ge 2で序列のあるカテゴリカル変数の場合
        • T_{AD}=¥sum_{j=1}^{C}¥sum_{i=1}^{k-1}(F_{ji}-¥bar{F_i})^2¥times (¥bar{F_i}(1-¥bar{F_i})¥frac{n-n_j}{n_j})^{-1}、ただし、F_jiは、グループjにおけるカテゴリ1-i累積人数の割合。¥bar{F_i}=¥frac{N_{.i}}{n}N_{.i}=¥sum_j N_{ji}
      • グループ数C ¥ge 2で序列のないカテゴリカル変数の場合
        • T_{AD}=¥sum_{j=1}^{C}¥sum_{i=1}^{k}(¥frac{f_{ji}}{n_j}-¥frac{f_{.i}}{n})^2¥times (f_{.i}(n-f_{.i})¥frac{n-n_j}{n_j})^{-1}