Market Basket Analysis

Association rule learningの発展

0,1ではなく量的なデータを使う 順序ありカテゴリにする、Discretization(離散化)する Fuzzy setを使う Genetic algorithm(Evolutionary algorithm)を使う アイテムに階層構造を持ち込む 発見されるルールの最適化

arulesパッケージ

2値の疎なデータにあって、項目間の包含関係を単純な比として数値化する手法 大規模なデータであるから、演算自体を非常に単純化してある 大規模なデータであるから、項目の組み合わせを限定する基準が必要 arulesパッケージを使ってみる arulesパッケージ …