遺伝子多型解析を数か月でできるようになるために〜第1回

Applied Statistical Genetics with R: For Population-based Association Studies (Use R!)

Applied Statistical Genetics with R: For Population-based Association Studies (Use R!)

  • Appendix R Basics
  • 本文でRを使うので、Rのインストールと使い方の基礎を
  • 起動と終了
  • エクセルとのデータのやり取り
  • 行列の扱い
  • 行について計算する
  • アレル頻度を出す
nr<-10
nc<-5
m<-matrix(sample(c(0,1,2),nr*nc,replace=TRUE),nr,nc)
m[,1]
# allele freq
sum(m[,1])/(2*length(m[,1]))
  • 実行結果
> nr<-10
> nc<-5
> m<-matrix(sample(c(0,1,2),nr*nc,replace=TRUE),nr,nc)
> m[,1]
 [1] 0 2 0 1 2 1 2 1 0 2
> # allele freq
> sum(m[,1])/(2*length(m[,1]))
[1] 0.55
> 
  • テキストファイル
    • エクセルで適当に0,1,2の値を作る
=IF(RAND()<0.3,1,IF(RAND()<0.2,2,0))
    • 適当な行・列数で作成して、テキスト(タブ区切り保存)"fileFromExcel.txt")
d<-read.table("fileFromExcel.txt")
dasmatrix<-as.matrix(d)
print(dasmatrix)
  • 実行結果
> d<-read.table("fileFromExcel.txt")
> dasmatrix<-as.matrix(d)
> print(dasmatrix)
      V1 V2 V3 V4
 [1,]  1  0  0  0
 [2,]  1  2  1  0
 [3,]  1  0  1  1
 [4,]  1  1  1  1
 [5,]  1  1  1  0
 [6,]  0  0  1  0
 [7,]  0  0  1  0
 [8,]  0  0  1  1
 [9,]  0  0  1  2
[10,]  1  0  1  1
[11,]  0  1  0  1
[12,]  1  0  0  2
[13,]  0  0  0  1