第9章 Missing dataの取り扱い



  • Missing dataとは
    • Missing at random (MAR), Observed at random (OAR), missing completely at random (MCAR)
    • MCARは一番簡単だが、MCARでなくても、観測データの分布の仕方と無関係にMissingしていれば、ignorableなmissing dataといえる
  • Missin dataの対処法
    • パラメトリックな統計法では、「削除する」、「補間する」の2法で対処する
    • パーミュテーションテストでは、あるがままに対処できる
      • パーミュテーションテストでは、観測ユニットのExchangeabilityについて観測された値もMissing dataも同様にExchangeableであるとみなしているからである
      • 観測値をパーミュテーションして、対応する統計量分布が観測データの統計量を棄却域に落とさないと同様に、Missingの状態をダミー変数化し、それがもたらす統計量についての部分検定も棄却されないことの両方が満たされたときにglobalな帰無仮説が棄却されないことになる
      • これは、観測データだけ個別に検定し、また、Missingダミー変数についてだけ個別検定し、そのANDを取る、という形に分解できる
    • MCARと仮定したときには、Missingダミー変数についての個別検定を省いた検定をすればよい