当たりくじ

  • 当たりくじが表示より不当に少なくしか入っていないかどうかを疑っているときのサンプリング鑑定

p1 <- 0.1
p2 <- 0.01

Ns <- 1:46

for(i in 1:length(Ns)){


N <- Ns[i]
db.1 <- dbinom(0:N,N,p1)
db.2 <- dbinom(0:N,N,p2)


cumsum.1 <- cumsum(db.1)
cumsum.2 <- cumsum(db.2)
cumsum.1. <- cumsum.1[length(cumsum.1):1]

a <- 0.05
b <- 0.8
up <- (0:N)[which(cumsum.1 < a)]
lo <- (0:N)[which(cumsum.2 > b)]

matplot(0:N,cbind(db.1,db.2),type="l")

abline(v=up[length(up)],col=3)
abline(v=lo[1],col=4)

print("---")
print(N)
print(up[length(up)])
print(lo[1])
print("===")
if(N>=45){
	print(cumsum.1)
	print(cumsum.2)
}

}
# 46回引いて、当たりが0回か1回なら
# それが起きる確率は、当たりくじの割合が0.1の場合には0.048
# 当たりくじの割合が0.01の場合には、0.922
# 従って、46回引いて当たりが1回以下であるときに、『このくじは不正である』とみなすことにすると
# False Positiveは0.048
# 当たりくじの割合が0.1と仮定したときのFalse Negative は0.078

# なお、45回引いた場合には
# 当たりくじの割合が0.1とすると、当たりが0本の確率は0.0087
# 当たりが0または1本の確率は0.052
# 当たりくじの割合が0.01とすると、当たりが0本の確率は0.636
# 当たりが0または1本の確率は0.925
# 従って、45回引いて、当たりが0本であるときに、『このくじは不正である』とみなすことにすると
# False Positiveは0.0087、そのときFalse Negativeは0.364なので、カットオフが厳しすぎる
# 当たりが1本以下であるときに『不正とみなす』ことにすると
# FPは0.052、FNは0.075となってパワーは十分だけれど、検定閾値として甘すぎる