2010-10-04

モデル

GEEの記事を書いている(昨日)
GEEの基礎には、一般化線形回帰を用いる
一般化線形回帰についてはこちらを
一般化線形回帰では、興味ある事象が、０か１かでもよいし、正規分布でもよいし、ポアッソン分布でもよい
興味ある事象(形質とそのフェノタイプ)の分布を再考することが必要になる
関節リウマチを考えよう
- 炎症性
- 破壊性
- 多関節炎
- 対称性
- 自己免疫性
上記のような特徴がある
ここで、多関節炎の項目と対称性関節炎の項目とに着目する
- 本当に関節リウマチは、「対称性」関節炎であることがその本質なのだろうか
- ある臨床所見で、「多」関節炎であることと「対称性」関節炎であることは、互いに独立ではないので、どうして、このような特徴が臨床判断上、「着目」されてきたのかには、説明があってしかるべきかもしれない
遺伝率を使って、遺伝因子と環境因子によって、正規分布様の疾患リスクを仮定することはよくある
遺伝・環境リスクの和が閾値を越えると「発症」する
ここまでをシミュレーションすれば次のようになる

N<-10000 # 人数
h<-0.8 # 遺伝率
prevalence<-0.01 # 有病率
GRisk<-rnorm(N,sd=sqrt(h)) # 遺伝リスク
ERisk<-rnorm(N,sd=sqrt(1-h))　# 環境リスク
AllRisk<-GRisk+ERisk # 遺伝リスクと環境リスクが独立としてやる。正規分布する
Phenotype<-rep(0,N) # 高リスク側のprevalence 分を発症者とする
Disease<-which(AllRisk>quantile(AllRisk,1-prevalence))
Phenotype[Disease]<-1

ここで、リウマチでは、関節炎がある
簡単のために、関節炎はリウマチ発症者にはあって、非発症者にはないものとする
リウマチの診断を受けた人は、ある数の炎症関節を持つ
ここで考えよう
リウマチという疾患を持っていようといまいと、関節の炎症は確率的に起きるものとし、炎症関節数がポアッソン分布で決まるとして、「多関節炎・対称性関節炎」の所見のある人がリウマチであって、それ以外の関節炎の人はリウマチではないとする
これだと、炎症関節を持たないヒトも多く、その点では、有病率が高くない(１％弱)であることに合致するが、炎症関節数が１であるようなヒト(非リウマチの単関節炎や非対称性関節炎の人)の数が非常に多くなる
現実にそぐわない
やはり、「リウマチ」の病理プロセス(自己免疫)が体内で全身疾患的に動くと、「何箇所かで炎症関節が出てくる」のではないだろうか
すると、「発症者」に対して、ある程度の数の炎症関節数を想定するのがよさそう
離散的な数なので、ポアッソン分布を使ってみると以下のようになるか・・・(発症の遺伝リスクをそのパラメタに用いてみた)

NumJoint<-rep(0,N)
mNumJoint<-mean(GRisk[Disease])
for(i in 1:length(Disease)){
 NumJoint[Disease[i]]<-rpois(1,GRisk[Disease[i]]/mNumJoint*4)
}
hist(NumJoint[Disease])

これは現実的な分布だろうか
また、初めの疑問「多関節炎」なのか「対称性関節炎」なのかについての話しとどうつながるのだろうか
０、１ではなく、２箇所以上の関節炎だと、必然的に「多」である。また、「対称性」である確率もかなり高くなる。特に、関節炎箇所数が多くなれば、片側に集中する確率は非常に小さいから、「対称性」を条件にすることは、関節数が多いことの条件になっており、特に、それは「関節数」という量的情報を、２値情報に変換する規則として、適当だった、ということなのかもしれない
また、その量的情報が、「関節数」を２以上と２未満、３以上と３未満などと分けるよりも「臨床実感」に近かったから、「対称性」という判断に価値があった、とも解釈できる
では、「n関節以上」という判断と「対称性」という判断との違いはいつ、どの程度で現れるのか、が次なる疑問。ここで一休み。