- 大学1回生に50分でデータ処理の「実務」を教えるとき
- コンテンツ
- 記録(スプレッドシート)
- Rへの読み込み・取り込み
- 集計・記述統計
- 視覚化
- 検定
- 記録(スプレッドシート、エクセル)
- ファイル(アクセスしてダウンロード)
- テキスト形式で保存しよう


data1 <- read.table("http://www.statgenet.med.kyoto-u.ac.jp/StatGenet/lectures/2016/MdPhDStatPrimer/Data1.txt",header=TRUE)
data1
data1.table <- table(tr=data1$Treatment,re=data1$Reaction)
data1.table
chisq.test(data1.table)
fisher.test(data1.table)
- 連続値データ
- ファイル(アクセスしてダウンロード)
- エクセルファイルをダウンロードして自分でテキストファイル化する練習をしてもよい
data2 <- read.table("http://www.statgenet.med.kyoto-u.ac.jp/StatGenet/lectures/2016/MdPhDStatPrimer/Data2.txt",header=TRUE)
data2
boxplot(data2$Reaction ~ data2$Treatment)
data2.0 <- data2$Reaction[which(data2$Treatment==0)]
data2.1 <- data2$Reaction[which(data2$Treatment==1)]
hist(data2.0)
mean(data2.0)
min(data2.0)
max(data2.0)
median(data2.0)
summary(data2.0)
t.test(data2.0,data2.1)
n <- 100
m <- 120
v <- 15
x <- rnorm(n, m, sqrt(v))
hist(x)
a <- 2.4
b <- 30
m.r <- 0
v.r <- 5
y <- a * x + b + rnorm(n, m.r, v.r)
plot(x,y)
cor(x,y)
lm.out <- lm(y ~ x)
lm.out
lm.out$coefficients
lm.coef <- lm.out$coefficients
plot(x,y)
abline(lm.coef[1],lm.coef[2],col="red")
points(x,predict(lm.out),pch=20,col="green")