Kruskal-Wallis

  • 今、全観測がN。観測グループ(サンプル)がk。それぞれの観測グループ(サンプル)に観測された数をn_i,i=1,2,...,k,\sum_{i=1}^kn_i=Nとする。第i観測グループの第j番目(j=1,2,...,n_iの観測値をv_{ij}とする。
  • Kruskal-Wallisでは、全レコードを順位に変換して扱う。これをr_{ij}とする。
    • 同一観測値のデータがある場合にはない場合の統計量を補正したものを用いるが、今、第p番目から第q番目までの観測値が同一であるときには、それらに、同一の順位を\frac{(p+q)(q-p+1)}{2}として与える。
  • 同一観測値データがない場合
    • T_{kw}=\frac{12}{N(N+1)}(\sum_{i=1}^k(\frac{R_i^2}{n_i})-\frac{N(N+1)^2}{4})
      • ただしR_i=\sum_{j=1}^{n_j}r_{ij}
  • 同一観測値データがある場合
    • T_{kw with Tie data}=T_{kw-t}=\frac{(N-1)N(N+1)}{12}\frac{1}{\sum_{i=1}^k \sum_{j=1}^{n_j}(r_{ij}^2) - \frac{N(N+1)^2}{4}}T_{kw}
    • T_{kw-t}=(N-1)\frac{\sum_{i=1}^k(\frac{R_i^2}{n_i})-\frac{N(N+1)^2}{4}}{\sum_{i=1}^k \sum_{j=1}^{n_j}(r_{ij}^2) - \frac{N(N+1)^2}{4}}
  • T_{kw},T_{kw-t}は自由度k-1のカイ自乗分布に従い、それに基づいてp値を得る。