離散的統計量のハンドリング



統計量Sがある。この統計量は、¥{v_i¥};i=1,2,...,Iなる値のいずれかをとるような離散的なものとする。

たとえば、ある周辺度数を満足するような分割表には有限な場合しかなく、この周辺度数に対応するフィッシャーの正確確率Pはこのような統計量である。

Javaでこれをハンドリングするときには、とりうる場合Iの長さをのリストを3つ用意する。ひとつは値を格納するvalue,もうひとつは、それぞれのvalueが起きる確率のためのprob,そして、累積確率のためのcumulProb。さらに、確率分布にとって重要な期待値expも格納させるとする。Fisherの正確確率はvalueとcumulProbとが一致する特殊な場合であるので、必要性がわかりにくいが、同様に周辺度数を固定した状態で、その周辺度数を満足するような分割表について、オッズ比を統計量として考えると、やはり、有限個のオッズ比の値について、それぞれ確率が与えられる。そして出やすいオッズ比と出にくいオッズ比とを勘案することで、cumulProbも与えることができる。

ひとたび離散的統計量のvalueとprobとcumulProbが与えられるとその、期待値は¥sum_{i=1}^I value¥[i¥]*prob¥[i¥]として算術的に得られる。また、そのような周辺度数から繰り返し、分割表を作成したときに得られる最小値の確率分布も計算でき、やはり、このクラスに格納可能である。

さらに、異なる周辺度数を持つ複数の分割表を一斉にサンプリングし、そのときの最小統計量がとる確率分布も算術的対象となる。