Jonckheere-Terpstra

  • Jonckheere-Terpstraでは、観測グループに順序を持ち込む。
  • そのためにk個のサンプルグループが作る\frac{k(k+1)}{2}ペア(k_x,k_y)について、次のようにランクに基づく量,U_{k_x,k_y}を算出し、それを全ペアについての総和\sum U_{k_x,k_y}をとる。
    • U_{k_x,k_y}は、k_x群の観測値について、k_y群の個々の観測値のうち、a個についてより大きく、b個について同一値だとしたときに、a+\frac{b}{2}という値を計算する。この値をk_x群のすべての観測値について足し合わせたもの。
  • その上で、この量を観測総数、グループ別観測数にて次のような統計量とすると、これは、標準正規分布に従うとされ、p値を求めることができる。
    • T_{jt}=\frac{\sum U_{k_x,k_y}-\frac{N^2-\sum_{i=1}^{k}n_i^2}{4}}{\sqrt{\frac{N^2(2N+3)-\sum_{i=1}^{k}n_i^2(2n_i+3)}{72}}}
    • 3群以上、とはいえ、2群にて計算できないわけではないので、2群データ(2x3分割表)にKruskal-Wallis, Jonckheere-Terpstraをあてはめ、その検定結果が、それぞれ、2x3分割表カイ自乗検定や、トレンドテストと、どのような対応関係になるかを確認する→エクセルはこちら(アップロード予定)。
  • これらを踏まえて、3ジェノタイプに量的データが得られた場合のKruskal-WallisとJonckheere-Terpstraを計算するエクセルはこちら
  • ちなみに、式中のU_{k_x,k_y}の性質から、グループの順序を逆順にしても統計量は同一。