多すぎるレコード
散布図を多数のレコードで描くとする。
散布図は、ぱらぱらとレコードが離散的に分布している様子をみるための図であるので、隣接レコード同士が重なってくると、本来の意味を持たなくなる。
そのようなときには、2次元度数分布にするなどの方法もあるが、データを加工するのも面倒なときが多い。
簡便にするには、ドットの大きさを小さくして、それなりの成果を達成すればよい。。。
こんなファイル "Book1.txt"があったとして
0.38501808 0.241976565 0.38361426 0.193551042 0.001419428 0.791369667 0.369364783 0.895753744 0.628640957 0.696313957 0.084539905 0.79423862 0.0834051 -0.367167136 0.778038172 -0.969121301 0.855634829 0.152042178 0.998805962 0.316992022 0.228275926 0.824184483 0.813058844 -0.860675627 0.54871484 0.818538505 0.02445151 -0.657298747 0.010034497 -0.597491403
data<-read.table(file="Book1.txt",sep="\t")
plot(data$V1,data$V2)
とするよりは、レコード数
N<-length(data$V1)を使って
plot(data$V1,data$V3,cex=1/N)
とするのも、一方法。ただし、Nは10000くらいで、効果が頭打ち(10万でも1/10000の効果しか出ない??)
掲載図は10000レコードの場合