Rのhaplo.statsの使い方(4)haplo.emの実行条件



  • 実行条件パラメタ
    • リスト
      • 多型を順次組み入れながら進めるが、その組み入れにあたっての順序(loci.insert.order)
      • 多型の組み入れにあたって、一度にまとめて組み入れる多型の数(insert.batch.size)
      • 稀すぎるハプロタイプを省きつつ進むが、その閾値事後確率(min.posterior)
      • 繰り返し処理で対数尤度の収束を目指すが、収束とみなすときの対数尤度の変化閾値(tol)
      • 最大繰り返し処理数(max.iter)
      • ハプロタイプ頻度の初回処理決定法(random.start)
      • 擬似乱数列の種(iseed)
      • 標準出力設定(verbose)
      • EM試行回数:試行の中で最も尤度が高いものを採用する(n.try)
      • 演算対象ハプロタイプ数の上限(メモリ上制約)(max.haps.limit)
    • 確認方法
      • デフォルト値は、コマンド > haplo.em.control で表示できる
      • haplo.em.controlは実行条件パラメタを管理する関数である

function (loci.insert.order = NULL, insert.batch.size = 6, min.posterior = 1e-07,
tol = 1e-05, max.iter = 5000, random.start = 0, n.try = 10,
iseed = NULL, max.haps.limit = 2e+06, verbose = 0)
{
...

        • loci.linsert.order:入力ファイルの並びがデフォルト
        • random.start: 0はgenotypeデータ基準で均等割り、1はgenotypeデータは無関係に均等割り。デフォルトは0。n.tryの2回目以降は、一様分布からランダムに割り当て。
        • iseed:特定値を与えれば、同一の擬似乱数列を使用するので、推定の再現ができる。デフォルトは特定値を与えず。
        • verbose:デフォルトは0で、最終結果のみ表示する。
      • 実施後の条件確認方法

> result<-haplo.em(geno,locus.label=label1$V1,weight=weight1,miss.val=9)
> result$control

にて、表示される。結果ももちろん、resultオブジェクトに格納されている

    • 条件変更方法
      • random.startを1に変更する場合

> result<-haplo.em(geno,locus.label=label1$V1,weight=weight1,miss.val=9,control=haplo.em.control(random.start =1 ))