第8章 Factorial designs



  • 多変量は組み合わせ項を調べたい
  • 観測がカテゴリカルな群に分かれている。その群間に違いがないことの検定をするにあたり、群を分ける尺度が1つであれば、one-way ANOVA、複数であれば、two-way ANOVA。こちらのサイトを参照
  • カテゴリ
    • 今、観測ユニット(サンプル)をカテゴリ分けするにあたり、n種類の変数があり、それぞれ、k_1,k_2,...,k_n個のカテゴリを持つとする。このとき、観測ユニットは、¥prod_{i=1}^{n}k_i通り分類される
    • データ表現
      • 観測ユニット(サンプル)がNあるとする。カテゴリ分けが¥prod_{i=1}^{n}k_i通りとする。
      • 今、このカテゴリ分けをさらにフルに組み合わせて、ありとあらゆる、カテゴリ分けの組み合わせを取り出したい。
      • たとえば、2変数があって、第1変数のカテゴリ数が(A,B)、第2変数のカテゴリ数が(1,2)であったとする。これが作る組み合わせカテゴリ分けは、2x2通り(A1,A2,B1,B2)
      • この効果項を考えるにあたり、個別のカテゴリについての効果と組み合わせ効果を考えることで、教科書では、{A},{B},{AB}としている。これは通常の多変量回帰の枠組み。これで行くと、カテゴリ数2の変数がk個あるときの効果項は2^k-1となり、このようなデータはサンプルユニット数x2-k-1 + 1(観測データ)の行列で表される。たとえば、各カテゴリ分けにつき、nサンプルを観測したとすれば、全観測は、n¥times 2^k。それぞれのサンプルの効果項についての情報を表すカラムが2^k-1、このサンプルの観測値が1カラム、なので、n¥times 2^k2^kの行列で表されることになる。
      • 少しひねって、カテゴリ分けの組み合わせ方の総当りを取ることも可能。
        • この4カテゴリ分けが作るカテゴリ分け組み合わせは第1変数の取り方だけで作られるもの、{A1,A2}vs{B1,B2}、第2変数の取り方だけで作られるもの、{A1,B1}vs{A2,B2}、第1、第2変数の取り方を組み合わせて作られるもの{A1}vs{A2,B1,B2},{A2}vs{A1,B1,B2},{B1}vs{A1,A2,B2},{B2}vs{A1,A2,B1},{A1,B2}vs{A2,B1}の7通り。これは、¥frac{_4C_1 + _4C_2+_4C_3}{2}
        • これは、epistasisのときの考え方に近い
  • Exchangeability
    • サンプルのカテゴリ分けが1次元であったときにはそのカテゴリについてパーミュテーションした。複数のカテゴリについてのパーミュテーションにあっては、その複数カテゴリカル変数の値のセットごとパーミュテーションする
  • 効果項ごとの統計量
    • 2個以上の変数について、ある変数(着目変数)の効果を他の変数の効果から独立性を検定するためには、他の変数について層別化した複数の仮説に対応した統計量を算出する必要がある(中間統計量)。この複数の層別化仮説に対応した中間統計量には、着目変数に関する量と、変数の組み合わせ項に関する量とが含まれているので、複数の中間統計量から、着目変数のみに依存する統計量と組み合わせ項に依存する統計量とを算出することで、、着目変数に対する仮説・組み合わせ項に対する仮説のそれぞれについて、パーミュテーショナルな値を得ることができる
    • このように、中間統計量から着目変数のみ・変数組み合わせ効果のみに対する統計量を算出するためには、exchangeに一定の条件が必要である。それは、ある組み合わせカテゴリから別の組み合わせカテゴリに入れ替えられるユニットの数が、対称的であるという条件である。それをSynchronized permutationsと呼ぶ
    • Synchronized permutation
      • 今、2変数の2x2=4 複合カテゴリに分けるとする。それぞれの複合カテゴリをAB,Ab,aB,abとする。このとき、カテゴリij とカテゴリxyとの入れ替わりユニット数を n(ij<->xy)と表すとする。n(AB<->aB)=n(Ab<->ab)のような入れ替えは、左項の入れ替えが、第2変数(B/b)について層別化して、Bでそろえた第1変数の入れ替え、右項の入れ替えは、第2変数(B/b)について層別化して、bでそろえた第1変数の入れ替えになっている。このように、ある変数についての入れ替えにあたって、それ以外の変数について層別化し、それについて対称的にpermutationすることが、synchronized permutationである
      • とはいえ、『どれだかわからないけれど、着目変数か組み合わせかのいずれかに違いがあるかないか』という仮説検定であれば、統計量の線形変換はしなくてもよいかもしれないけれども・・・(未確認)