確率変数を表す関数

http://www.genome.med.kyoto-u.ac.jp/StatGenet/testRY20110208/Prob-related-functions.jpeg

  • 1変数XX=x;x\in Dである確率をP(X=x)と書くことにする
  • 確率密度関数f(x)=P(X=x)
    • f(x) \ge 0
    • \int_{x \in D} f(x)=1
    • "Xがxである確率"
  • 積分布関数F(x)
    • F(x)=P(X\le x)
    • \frac{d F(x)}{dx}=f(x)
    • "Xがx以下である確率"
  • 昇降順を逆にした累積分布関数S(x)
    • 生存関数とも言う
    • S(x)=P(X>x)
    • S(x)=1-F(x)
    • "Xがxより大きい(長生きする)確率"
    • "Xを用いて検定するときはS(x)はp値"
  • 逆累積分布関数G(t)
    • P(X \le G(t))=t
    • "累積確率がtのときのXの値"
    • F(x)=P(X\le x)F(x),xをひっくり返したもの
  • 昇降順を逆にした累積分布関数の逆関数Z(t)
    • P(X > Z(t))=t
  • ハザード関数h(x)
    • h(x)=\frac{f(x)}{S(x)}
    • "X=xに「生き残っている画分がX=xで死亡する」確率"
  • 累積ハザード関数H(x)
    • \frac{d H(x)}{dx}=h(x)
    • H(x)=-log(S(x)) # 指数関数の場合
  • 指数関数について、これをRでやってみる
    • f,F,G,S,Z,h,Hのうちで、「一番単純」なのは、h(x)が一定であること
    • "経過中のあるときにあって、「それまでは死亡していなくて」「まさにそのときに死亡する」確率が、一定"であること
      • 『無記憶性』
par(mfcol=c(3,3))

N<-100000
m<-1

xMax<-10
x<-seq(from=0,to=xMax,length.out=N)

f<-dexp(x,m)

plot(x,f,type="l",main="probability function")

F<-pexp(x,m)

plot(x,F,type="l",main="cumulative distribution function")
abline(h=1,col=2)

G<-qexp(F,m)
# G=x
plot(F,x,type="l",xlim=c(0,1),main="INVERSE cumulative distribution function")

S<-1-F
S2<-pexp(x,m,lower.tail=FALSE) # lower.tailの使い分けがFとSの違い
#plot(S,S2)

plot(x,S,type="l",main="Survival function:1-F;DECREASING cumulative distribution function")
abline(h=1,col=2)

Z<-qexp(S,m,lower.tail=FALSE)
#plot(x,Z)
# Z=x
plot(S,x,type="l",xlim=c(0,1),main="INVERSE survival function:INVERSE DECREASING cumulative distribution function")
abline(v=0,col=2)


h<-f/S

plot(x,h,ylim=c(0,2),main="hazard function")

H<--log(S)

plot(x,H,main="cumulative hazard function")
par(mfcol=c(1,1))