駆け足で読むRで学ぶクラスタ解析 第6章 混合分布モデル EMアルゴリズム

  • データの背景に複数のモデルがあり、そのモデルのいずれかによって、観測データのそれぞれは得られ、観測における誤差によって、全データの分布が説明できるとみなす
  • 個々のモデルを、期待値ベクトルで表し、そこからの誤差を多次元正規分布によって近似する
  • 個々のモデルの混合比を与え、個々のデータは、個々のモデルの混成比と個々のモデルのもとでの観測確率との積によって、どのモデルからのデータであるかの帰属を定める
  • モデル数とモデルパラメタを固定した上で、モデルの混成比をEMアルゴリズムによって推定する
  • Rでの解析
    • mclustパッケージを読み込みMclust関数などを使う