2項分布の正規分布近似と尤度比検定



たぶん、式変形はあっています。

確率pでおきる事象のN回の独立試行で、X回起きる確率は、P(X,N,p)=¥; _NC_X p^X(1-p)^{N-X}である。今、Nが十分に大きく、pが小さすぎないとき、正規分布に近似して、Q(X,N,p)=¥frac{1}{¥sqrt{2¥pi}}¥frac{1}{¥sqrt{Np(1-p)}}e^{-¥frac{(X-Np)^2}{2Np(1-p)}}と表される。今、観測データからモーメント法で算出した事象の生起確率の期待値はp_1=¥frac{X}{N}であるから、上式を書き換えてQ(p_1,N,p)=¥frac{1}{¥sqrt{2¥pi}}¥frac{1}{¥sqrt{Np(1-p)}}e^{-¥frac{(Np_1-Np)^2}{2Np(1-p)}}

今、第1群にてn_1サンプル、第2群にて同じくn_2サンプルをとったところ、p_1,p_2という期待値が得られたとする。両群が同一母集団からとられたとする帰無仮説において、その生起確率の最尤推定値はp_0={p_1n_1+p_2n_2}{n_1+n_2}である。このような帰無仮説において、今回のようなサンプリングがなされる確率はPr_{n}=Q(p_1,n_1,p_0) ¥times Q(p_2,n_2,p_0)=¥frac{1}{2¥pi}¥frac{1}{¥sqrt{n_1n_2}p_0(1-p_0)}e^{-¥frac{(n_1p_1-n_1p_0)^2}{2n_1p_0(1-p_0)}-¥frac{(n_2p_2-n_2p_0)^2}{2n_2p_0(1-p_0)}}

一方、対立仮説においては、第1群の母集団の生起確率の最尤推定値はp_1,第2群はp_2であるから、対立仮説において、このようなサンプリングがなされる確率はPr_{h}=Q(p_1,n_1,p_1)¥times Q(p_2,n_2,p_2)=¥frac{1}{2¥pi}¥frac{1}{¥sqrt{n_1n_2p_1(1-p_1)p_2(1-p_2)}}

尤度比検定においてはRatio=Pr_{h}/Pr_{n}=¥frac{p_0(1-p_0)}{¥sqrt{p_1(1-p_1)p_2(1-p_2)}}e^{¥frac{(n_1p_1-n_1p_0)^2}{2n_1p_0(1-p_0)}+¥frac{(n_2p_2-n_2p_0)^2}{2n_2p_0(1-p_0)}}

の大きさを問題とする。今、簡単のためにn_1=n_2=nの場合に限定すると、p_1=p_0(1+¥Delta),p_2=p_0(1-¥Delta)と書けて

Ratio=¥frac{p_0(1-p_0)}{¥sqrt{(p_0(1+¥Delta))(1-p_0(1+¥Delta))(p_0(1-¥Delta)(1-p_0(1-¥Delta))}}e^{¥frac{n¥Delta^2p_0^2}{p_0(1-p_0)}}

この値の対数をとると¥ln(Ratio)=¥ln{¥frac{(¥frac{1}{p_0}-1)}{¥sqrt{(1+¥Delta)(¥frac{1}{p_0}-1-¥Delta)(1-¥Delta)(¥frac{1}{p_0}-1+¥Delta)}}}+¥frac{n¥Delta^2}{(¥frac{1}{p_0}-1)}

¥ln(Ratio)=¥ln{¥frac{(¥frac{1}{p_0}-1)}{¥sqrt{(1-¥Delta^2)((¥frac{1}{p_0}-1)^2-¥Delta^2)}}+¥frac{n¥Delta^2}{(¥frac{1}{p_0}-1)}