- Strataでまとめること
- 前の記事で個人をグループに振り分けて3時刻で測定するという例を扱った。このとき、個人の特性がばらつきをもたらすことを前提に解析していた
- それを個人と言うStrataでまとめる、と言っている
- 再度、出力を見直してみる
- Error: idとError: Withinとに大別されている
- idであろうとWithinであろうとSum Sqは対等に足し合わせる関係であることは前の記事で示した通り
- では、idとWithinはどういう意味なのだろうか
- Withinはidごとに分けた上で、そのidのそろったレコードの中での要因別(以下の例ではtime,group:timeの2つと残差)のばらつきが示されている。ただし同一idが複数のgroupには対応していないから、groupという要因は現れていない
- 他方、idの方は、「同一のidであるならば、必ずある特定のgroupに対応する」という関係があるので、groupという要因についてはSum Sqが計算され、それ以外はResidualsになっている
> summary(demo1.aov)
Error: id
Df Sum Sq Mean Sq F value Pr(>F)
group 1 155.04 155.04 3721 1.3e-09 ***
Residuals 6 0.25 0.04
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
time 2 0.0833 0.04167 1 0.397
group:time 2 0.0833 0.04167 1 0.397
Residuals 12 0.5000 0.04167
-
- この要因同士の「含まれる、含まれない」の関係が出力にどういう影響があるのかを実際に、formulaを変えてみることで追いかけてみる
- 解釈がまだ不安ですが…
- timeでStrataを作ると、time=1だからと言って、idが特定されるわけでもgroupが特定されるわけでもないので、Error: timeには要因はなく残差しかない
- また、idでのレコードの分割したあとにはgroupで更に分ける余地はないので、groupによる分割は無意味である。したがってError: Withinの方にはgroupもid:groupも登場していない
> demo1.aov <- aov(pulse ~ id * group + Error(time), data = demo1)
> summary(demo1.aov)
Error: time
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 2 0.08333 0.04167
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
id 7 155.29 22.185 532.4 6.9e-16 ***
Residuals 14 0.58 0.042
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1
-
- 今度はgroupでStrataを切ってみる
- groupはidで細分できるのでError: groupにはidを要因とする行がある。しかしながら、idでの細分によってgroupでの細分はすべて説明できてしまうので残差はない
- 他方、Error: Withinの方では、同一グループ内でidとtimeとその組合せが存在するのでid, time, id:timeの3要因に対応する行があるが
> demo1.aov <- aov(pulse ~ id * time + Error(group), data = demo1)
> summary(demo1.aov)
Error: group
Df Sum Sq Mean Sq
id 1 155 155
Error: Within
Df Sum Sq Mean Sq
id 6 0.2500 0.04167
time 2 0.0833 0.04167
id:time 14 0.5833 0.04167