おさらい

  • こちらから
  • t分布、t検定の話が出た
  • Wikiでのt分布の記事はこちら
  • 少サンプルの標本平均と想定している平均との差は標本分散とサンプル数とを使って補正した統計量であるTについて考えると、その統計量の分布が知られているので、「外れている程度」が評価できる
  • この記事で書かれていることをRで実施すると
# 母集団の平均とSD(正規分布)
m<-10
sd<-3
# 試行回数
Niter<-1000
# 1試行あたりの標本数
Nsample<-5
# 試行の結果を格納
sampleMean<-rep(0,Niter)
sampleVar<-rep(0,Niter)
Ts<-rep(0,Niter)
for(i in 1:Niter){
	tmpSamples<-rnorm(Nsample,m,sd)
	sampleMean[i]<-mean(tmpSamples)
	sampleVar[i]<-var(tmpSamples)
}
# Tを計算
Ts<-(sampleMean-m)/(sqrt(sampleVar)/sqrt(Nsample))
Ts<-sort(Ts)
# p値が0-1に均一に分布するとして、対応するT値を計算
expTs<-qt(ppoints(Niter,a=0),df=Nsample-1)
hist(Ts)
# シミュレーションのTと理論のTとの関係を見る
plot(Ts,expTs)
abline(0,1,col=2)