欠測値のある入力ファイルからのread.table()入力



入力ファイルにはいろいろな欠測値のパターンがあり、それをいろいろなパターンでRに取り込むことができるが、繰り返し使用を念頭に、1方法に限定する。

欠測値はテキストファイルではブランクであるものとし、Rでは"NA"として登録するものとする。

入力テキストファイルのサンプル"data2.txt"は以下の通り


0 0 12.56015346 0 0 72.40283678
0 0 39.43844133 1 0 46.9776176
0 0 7.301054876 0 1 67.87662418
0 1 62.06361218 1 1
0 1 33.16076475 0 1 5.555290139
0 1 71.91200650 1 2 62.17897915
0 1 29.85631683 2 51.90474532
0 1 31.79041671 1 2 95.68355182
0 1 63.74766494 0 1 86.7186155
2 87.72226060 1 38.0244358
1 0 90.59398098 0 1 43.0125757
1 0 30.55458087 1 0 46.33420694
1 92.14168703 0 0 86.8607626
1 0 89.21685630 1 0 62.09198145
1 0 78.57679256 0 1 31.08457985
1 0 1 0 54.8118676
1 0 91.58997685 0 0 73.41244926
1 1 21.36825410 1 2 62.69090374
1 1 93.26187408 0 2 74.64388105
1 1 62.11437583 1 2 0.042787864

の入力は、read.table("data2.txt")ではエラーになる。

区切り記号を指定(sep="\t")してやることで、入力ができた。


> data2<-read.table("data2.txt",sep="\t")
> data2
V1 V2 V3 V4 V5 V6
1 0 0 12.560153 0 0 72.40283678
2 0 0 39.438441 1 0 46.97761760
3 0 0 7.301055 0 1 67.87662418
4 0 1 62.063612 1 1 NA
5 0 1 33.160765 0 1 5.55529014
6 0 1 71.912007 1 2 62.17897915
7 0 1 29.856317 NA 2 51.90474532
8 0 1 31.790417 1 2 95.68355182
9 0 1 63.747665 0 1 86.71861550
10 NA 2 87.722261 1 NA 38.02443580
11 1 0 90.593981 0 1 43.01257570
12 1 0 30.554581 1 0 46.33420694
13 1 NA 92.141687 0 0 86.86076260
14 1 0 89.216856 1 0 62.09198145
15 1 0 78.576793 0 1 31.08457985
16 1 0 NA 1 0 54.81186760
17 1 0 91.589977 0 0 73.41244926
18 1 1 21.368254 1 2 62.69090374
19 1 1 93.261874 0 2 74.64388105
20 1 1 62.114376 1 2 0.04278786
>

続きは:ryamadaの遺伝学・遺伝統計学メモ - 1つのデータセットにあるすべての独立変数・従属変数の組み合わせで単変量解析を実施する。