Rのhaplo.statsの使い方(9)haplo.scoreの実行



  • データの準備
    • 個人別ジェノタイプデータ・その他の個人別データ・遺伝子多型ラベルデータ
    • テキストファイルからの作成は、haplo.em, haplo.gmlとほぼ同様なので、詳しくはそちらを参照

#genotype情報の取り込み
geno<-read.table("genotype.txt",FALSE,"\t")
#多型ラベル情報も取り込む
label1<-read.table("snp.info",FALSE,"\t")
#ハプロタイプ推定用ジェノタイプ以外の情報の取り込み
data2<-read.table("data2.txt",FALSE,"\t")

  • 解析の実行
    • binomialデータの場合(値は0か1)
      • data2の第1列(data2$V1)が{0,1}の値を有するbinomialであり、これとハプロタイプとの関係を調べるとき

score.v1<-haplo.score(data2$V1,geno,trait.type="binomial",locus.label=label1$V1)

    • ordinalデータの場合(3つ以上の値にを有する列)
      • data2の第2列(data$V2)がordinalデータとしてハプロタイプとの関係を調べるとき

score.v2<-haplo.score(data2$V2,geno,trait.type="ordinal",locus.label=label1$V1)

    • 量的形質(正規分布とみなす)データの場合
      • data2の第3列(data$V3)がgauusianデータとしてハプロタイプとの関係を調べるとき

score.v3<-haplo.score(data2$V3,geno,trait.type="gaussian",locus.label=label1$V1)

    • シミュレーションベースで行うとき

#シミュレーションベースでbinomialデータについて解析を行うとき
score.v1.sim<-haplo.score(data2$V1,geno,trait.type="binomial",locus.label=label1$V1,simulate=TRUE)
#シミュレーション条件を指定するときは、score.sim.control関数を用いて指定する
score.v1.sim.cond<-haplo.score(data2$V1,geno,trait.type="binomial",locus.label=label1$V1,simulate=TRUE,sim.control=score.sim.control(min.sim=200,max.sim=500))

    • 層別化して行うとき

#層別化用のデータを作成する
#data2$V1,data2$V2とで層別化してdata2$V3について解析をする場合
adj<-cbind(data2$V1,data2$V2)
score.v3.adj<-haplo.score(data2$V3,geno,trait.type="gaussian",locus.label=label1$V1,x.adj=adj)