駆け足で読むRで学ぶクラスタ解析 第8章 次元縮約
- 高次元データは、データベクトル間の距離の短いものをまとめるというクラスタリングの基本において、不適切な結果へ導きやすくするという問題を持つ。これを解決するために、データベクトルの特性を失わずに次元を小さくすることが効果的であり、それを次元縮約と言う。いくつかの方法が知られている
- 特異値分解
- LSI(Latent Semantic Indexing)
- pLSI(Probabilistic Latent Semantic Indexing)
- NMF(Non-negative Matrix Factorization)