グラフの類似性を評価する
- はじめに
- 参考PDF
- グラフの同形性評価(graph isomorphism)と類似性評価
- Graph isomorphismはグラフ構成要素であるノードの1対1対応とエッジの1対1対応によって定義されている。それに対して、類似性評価は同形性からのはずれの程度の評価であり、その尺度は定義に依存する
- グラフの類似度評価
- 評価の指標(グラフ間距離)に求められるもの
- Metric
- 同一グラフ間距離は0
- グラフAからグラフBへの距離とグラフBからグラフAへの距離は同一(対象性 Symmetry)
- グラフAからBへの距離とグラフBからCへの距離の和はグラフAからCへの距離を越えない(Triangle inequality)
- Metric
- 評価方法
- Graph edit distance法
- 2つのグラフを比較し、グラフに操作(ノードおよびエッジの削除・挿入・置換)を加えることで、両グラフを同一にするときに、その最小操作によってグラフ間距離を定義する方法
- Maximum common subgraph法→別項を立てる
- Graph edit distance法
- 評価の指標(グラフ間距離)に求められるもの
- Maximum common subgraph法
- Maximum common subgraphを用いて、グラフ間の距離を定義する方法
- Maximum common subgraphとは
- Isomorophism と Subisomorphism
- Isomorphismは「同形」、Subisomorphismは「部分同形:グラフのサブグラフがあるグラフの全体と同形であるとき、サブグラフを含むグラフが、比較したグラフと部分同形であるという」
- Common subgraph
- あるグラフが存在して、それに対して、2つのグラフがSubisomorphicであるとき、その2つのグラフのCommon subgrapであると言う
- ある2グラフのCommon subgraphのうち、ノード数が最大のものをmaximum common subgraphという
- Isomorophism と Subisomorphism
- Maximum common subgraphとは
- Maximum common subgraphを用いたグラフ間距離の定義
- グラフG1とグラフG2とのmaximum common graphがG3であるとする
- それぞれのノード数をVn(G1),Vn(G2),Vn(G3)とする
- 距離は次式で定義される
- この定義がmetricであることの証明は、参考PDFより
- Maximum common subgraphを用いて、グラフ間の距離を定義する方法
- Maximum common subgraphの検出
- Maximu common subgraphの検出は、NP-complete問題である
- 実用には、approximationが必要
- TFS (Toporogical Fragment Spectra)