検定と検出力、仮説とモデル

  • 今、k次元空間\Omega=\mathbf{R}^kを考える
  • この空間に確率密度分布h(\mathbf{t}); h(\mathbf{t}) \ge 0,\mathbf{t} \in \Omegaがあるとする
    • 定義より\sum_{\Omega} h(\mathbf{t}) d \mathbf{t}=1
    • \mathbf{x} \in \OmegaP_h(\mathbf{x}) = \int_{h(\mathbf{t})\le h(\mathbf{x})} h(\mathbf{t}) d\mathbf{t}を定義すると、0 \le P_h(\mathbf{x})\le 1
  • 一方、同じ空間\Omegaに統計量m(\mathbf{t});\mathbf{t} \in \Omegaを定義する
    • 空間\Omegaに定義されたある確率密度分布h_i(\mathbf{t})があるとき、
    • P_{m,h_i}(\mathbf{x})=\int_{m(\mathbf{t}) \le m(\mathbf{x})} h_i(\mathbf{t}) d \mathbf{t}を定めることができて、
    • 0 \le P_{m,h_i}(\mathbf{x}) \le 1である
    • ここで、空間\Omegaにおいて、2つの統計量m_1,m_2があったときに、m_1(\mathbf{x_1}) = m_1(\mathbf{x_2})であれば、m_2(\mathbf{x_1})=m_2(\mathbf{x_2})であり、かつm_1(\mathbf{x_1}) > m_1(\mathbf{x_2})であれば、m_2(\mathbf{x_1}) > m_2(\mathbf{x_2})であり、それらの逆もまた真であるとき、P_{m_1,h_i}(\mathbf{x})=P_{m_2,h_i}(\mathbf{x})であることに注意する
  • P_{h_i},P_{m,h_i}逆関数を確認しておく
    • P^{-1}_{h_i}(a)=\mathbf{x_a}P_{h_i}(\mathbf{x_a})=aを意味し
    • P^{-1}_{m,h_i}(a)=\mathbf{x_a}P_{m,h_i}(\mathbf{x_a})=aを意味する
    • なお、これは統計量は「順序付けの方法」であることを意味するが、「順序付けでは、大小方向を逆にすることで本質的な違いがない」ことも確認しておく(検定統計量では、生起確率の大小の向きと統計量の大小の向きが逆転していることが多いことから、このことを指摘するものである)
  • ここで定義したP_{h_i},P_{m,h_i}を用いて、棄却検定、検定の検出力を表記することとする
  • 検定
    • 検定では、ある確率密度分布h_1を仮定(検定されるべき仮説)している
    • 検定では、空間に統計量を与えている
      • 通常の帰無仮説検定では、確率密度分布の最大値を与える点(のすべて)において、統計量が最大値となっている
        • このことを式で表すとP_{m,h_1}(P^{-1}_{h_1}(1))=1となる
    • このような仮定と統計量の下で、\mathbf{x}が観測されたときに、検定されるべき仮説を信じる程度がP_{m,h_1}(\mathbf{x})である
    • 仮説(確率密度分布の仮定)があって、モデル(統計量の置き方)があって、観測データがあるときに、仮説に関する判断の情報を与えている
      • 観察と仮説と生起確率の関係では、ある仮説の下での観察の起きる確率と、ある観察をもたらす仮説の尤度は同じものであるが、「検定」では「観察を下に、仮説についての判断情報を与えている」ので、『尤度』を考えるときと同じ向きのプロセスとなっている
  • 検出力
    • 検出力を考えるときには、ある確率密度分布h_2を仮定している
    • 検定が定義されている
      • 検定には、h_2とは異なる確率密度分布h_1が仮定されている
      • 統計量も与えられている
    • 検出力を考えるときには
      • h_1 \not = h_2である(のが普通)
      • また、P_{m,h_1}(P^{-1}_{h_1}(1))=1が普通であるしP_{m,h_2}(P^{-1}_{h_2}(1)) \not = 1も普通である
    • 検定用の仮説h_1があって、h_1を検定するための統計量m_1があって、その2つが定めるP_{m,h_1}があり、もう一つの仮説h_2があるときに、どのような観察をどれくらいの確率でするかについての情報を与える
      • 観察と仮説と生起確率の関係では、ある仮説の下での観察の起きる確率と、ある観察をもたらす仮説の尤度は同じものであるが、「検出力」では「第2の仮説を下に、観察の生起確率に関する情報を与えている」ので、『確率』を考えるときと同じ向きのプロセスとなっている