EMの初期値と収束



EMアルゴリズムは、その簡単なアルゴリズムにも関わらず、最大尤度を与える推定値への収束が知られている。

しかしながら、離散分布においては、特に周辺分布(ハプロタイプ頻度ならば、ゼロに近い

頻度)において、収束速度の低下や、極大尤度への収束が起きる。

EMにおいては、複合ジェノタイプから非決定的ハプロタイプ組み合わせの割り振り方としては

  • (1)決定的ハプロタイプ頻度に比例して、非決定的染色体本数を振り分ける
  • (2)非決定的染色体本数を4ハプロタイプに均等に振り分ける
  • (3)非決定的染色体本数によらず、4ハプロタイプに均等にある本数を振り分ける(下の例では0.1本を示す)

などの方法がある。今、これらの方法によるハプロタイプ収束頻度とその収束時の対数尤度を示す。

確認のためのエクセルはこちら

  • 表示は左から4つがハプロタイプ頻度、最後が常用対数尤度
  • 例1 10,0,3,0 80,0,5,0,0(左から、AABB,AABb,AAbb,AaBB,...,aabb)
    • 方法(1)と方法(3)がD'=1の状態への収束をしめし、最大尤度を与えている
    • 方法(1)0.10204082 0.43877551 0.45918367 0.00000000 -56.93049776
    • 方法(2) 0.50649559 0.03432074 0.05472890 0.40445477 -57.99781324
    • 方法(3)0.10204082 0.43877551 0.45918367 0.00000000 -56.93049776
  • 例2 100,0,29,0,80,0,10,0,0
    • 方法(2)と方法(3)がD'<1の状態への収束をしめし、最大尤度を与えている
    • 方法(1)0.45662100 0.31506849 0.22831050 0.00000000 -177.37394769
    • 方法(2)0.62531392 0.14637557 0.05961758 0.16869292 -164.97619561
    • 方法(3)0.62531392 0.14637557 0.05961758 0.16869292 -164.97619561
  • 例3 10 0,3,0,40,0,1,0,0
    • 方法(2)の方法がD'<1の状態への収束をしめし、最大尤度を与えている
    • 方法(1)0.18518519 0.42592593 0.38888889 0.00000000 -36.88463540
    • 方法(2)0.55339949 0.05771162 0.02067458 0.36821431 -31.43257241
    • 方法(3)0.18518519 0.42592593 0.38888889 0.00000000 -36.88463540