モデル

  • GEEの記事を書いている(昨日)
  • GEEの基礎には、一般化線形回帰を用いる
  • 一般化線形回帰についてはこちら
  • 一般化線形回帰では、興味ある事象が、0か1かでもよいし、正規分布でもよいし、ポアッソン分布でもよい
  • 興味ある事象(形質とそのフェノタイプ)の分布を再考することが必要になる
  • 関節リウマチを考えよう
    • 炎症性
    • 破壊性
    • 多関節炎
    • 対称性
    • 自己免疫性
  • 上記のような特徴がある
  • ここで、多関節炎の項目と対称性関節炎の項目とに着目する
    • 本当に関節リウマチは、「対称性」関節炎であることがその本質なのだろうか
    • ある臨床所見で、「多」関節炎であることと「対称性」関節炎であることは、互いに独立ではないので、どうして、このような特徴が臨床判断上、「着目」されてきたのかには、説明があってしかるべきかもしれない
  • 遺伝率を使って、遺伝因子と環境因子によって、正規分布様の疾患リスクを仮定することはよくある
  • 遺伝・環境リスクの和が閾値を越えると「発症」する
  • ここまでをシミュレーションすれば次のようになる
N<-10000 # 人数
h<-0.8 # 遺伝率
prevalence<-0.01 # 有病率
GRisk<-rnorm(N,sd=sqrt(h)) # 遺伝リスク
ERisk<-rnorm(N,sd=sqrt(1-h)) # 環境リスク
AllRisk<-GRisk+ERisk # 遺伝リスクと環境リスクが独立としてやる。正規分布する
Phenotype<-rep(0,N) # 高リスク側のprevalence 分を発症者とする
Disease<-which(AllRisk>quantile(AllRisk,1-prevalence))
Phenotype[Disease]<-1
  • ここで、リウマチでは、関節炎がある
  • 簡単のために、関節炎はリウマチ発症者にはあって、非発症者にはないものとする
  • リウマチの診断を受けた人は、ある数の炎症関節を持つ
  • ここで考えよう
  • リウマチという疾患を持っていようといまいと、関節の炎症は確率的に起きるものとし、炎症関節数がポアッソン分布で決まるとして、「多関節炎・対称性関節炎」の所見のある人がリウマチであって、それ以外の関節炎の人はリウマチではないとする
  • これだと、炎症関節を持たないヒトも多く、その点では、有病率が高くない(1%弱)であることに合致するが、炎症関節数が1であるようなヒト(非リウマチの単関節炎や非対称性関節炎の人)の数が非常に多くなる
  • 現実にそぐわない
  • やはり、「リウマチ」の病理プロセス(自己免疫)が体内で全身疾患的に動くと、「何箇所かで炎症関節が出てくる」のではないだろうか
  • すると、「発症者」に対して、ある程度の数の炎症関節数を想定するのがよさそう
  • 離散的な数なので、ポアッソン分布を使ってみると以下のようになるか・・・(発症の遺伝リスクをそのパラメタに用いてみた)
NumJoint<-rep(0,N)
mNumJoint<-mean(GRisk[Disease])
for(i in 1:length(Disease)){
 NumJoint[Disease[i]]<-rpois(1,GRisk[Disease[i]]/mNumJoint*4)
}
hist(NumJoint[Disease])
  • これは現実的な分布だろうか
  • また、初めの疑問「多関節炎」なのか「対称性関節炎」なのかについての話しとどうつながるのだろうか
  • 0、1ではなく、2箇所以上の関節炎だと、必然的に「多」である。また、「対称性」である確率もかなり高くなる。特に、関節炎箇所数が多くなれば、片側に集中する確率は非常に小さいから、「対称性」を条件にすることは、関節数が多いことの条件になっており、特に、それは「関節数」という量的情報を、2値情報に変換する規則として、適当だった、ということなのかもしれない
  • また、その量的情報が、「関節数」を2以上と2未満、3以上と3未満などと分けるよりも「臨床実感」に近かったから、「対称性」という判断に価値があった、とも解釈できる
  • では、「n関節以上」という判断と「対称性」という判断との違いはいつ、どの程度で現れるのか、が次なる疑問。ここで一休み。