2008-04-26 駆け足で読むRで学ぶクラスタ解析 第6章 混合分布モデル EMアルゴリズム 駆け足で読むシリーズ クラスタ解析 データの背景に複数のモデルがあり、そのモデルのいずれかによって、観測データのそれぞれは得られ、観測における誤差によって、全データの分布が説明できるとみなす 個々のモデルを、期待値ベクトルで表し、そこからの誤差を多次元正規分布によって近似する 個々のモデルの混合比を与え、個々のデータは、個々のモデルの混成比と個々のモデルのもとでの観測確率との積によって、どのモデルからのデータであるかの帰属を定める モデル数とモデルパラメタを固定した上で、モデルの混成比をEMアルゴリズムによって推定する Rでの解析 mclustパッケージを読み込みMclust関数などを使う