Ｒのhaplo.statsの使い方（４）haplo.emの実行条件 - ryamadaの遺伝学・遺伝統計学メモ

実行条件パラメタ
- リスト
  - 多型を順次組み入れながら進めるが、その組み入れにあたっての順序(loci.insert.order)
  - 多型の組み入れにあたって、一度にまとめて組み入れる多型の数(insert.batch.size)
  - 稀すぎるハプロタイプを省きつつ進むが、その閾値事後確率(min.posterior)
  - 繰り返し処理で対数尤度の収束を目指すが、収束とみなすときの対数尤度の変化閾値(tol)
  - 最大繰り返し処理数(max.iter)
  - ハプロタイプ頻度の初回処理決定法(random.start)
  - 擬似乱数列の種(iseed)
  - 標準出力設定(verbose)
  - EM試行回数:試行の中で最も尤度が高いものを採用する(n.try)
  - 演算対象ハプロタイプ数の上限(メモリ上制約)(max.haps.limit)
- 確認方法
  - デフォルト値は、コマンド > haplo.em.control で表示できる
  - haplo.em.controlは実行条件パラメタを管理する関数である



function (loci.insert.order = NULL, insert.batch.size = 6, min.posterior = 1e-07, 

    tol = 1e-05, max.iter = 5000, random.start = 0, n.try = 10, 

    iseed = NULL, max.haps.limit = 2e+06, verbose = 0) 

{

...

loci.linsert.order:入力ファイルの並びがデフォルト
random.start: 0はgenotypeデータ基準で均等割り、1はgenotypeデータは無関係に均等割り。デフォルトは0。n.tryの2回目以降は、一様分布からランダムに割り当て。
iseed:特定値を与えれば、同一の擬似乱数列を使用するので、推定の再現ができる。デフォルトは特定値を与えず。
verbose:デフォルトは0で、最終結果のみ表示する。

実施後の条件確認方法



> result<-haplo.em(geno,locus.label=label1$V1,weight=weight1,miss.val=9)

> result$control

にて、表示される。結果ももちろん、resultオブジェクトに格納されている

条件変更方法
- random.startを1に変更する場合



> result<-haplo.em(geno,locus.label=label1$V1,weight=weight1,miss.val=9,control=haplo.em.control(random.start =1 ))

翌日に続く