ぱらぱらめくる『A Brief Introduction to Statistical Shape Analysis』形の統計解析

  • 多次元視覚について書いていて(こちら)、多次元視覚には、「形」の観察と「トモグラム」的観察があることも書いた(こちら)
  • 「形」の観察の統計学は"Statistical shape analysis"(Wiki記事)と言われる分野である
  • そこでは、形の定義があって(形とは、位置・縮尺・回転などによって変わらない幾何学的性質Wiki記事であって、言い換えると、等長変換(rigid transformation)と均等スケーリング(uniform scaling)とによって変化しない幾何学的性質)、それに基づいて、モデル的形のカタログがあり、それとの異同を定量的に評価している
  • そんな形の統計解析の資料PDF(こちら)
  • Rでは"shapes"パッケージというのがあってProcrustes analysis(Wiki)を実装したものらしい
  • ちなみに「トモグラム」的観察の方は情報が一次元分増えるので、n次元オブジェクトのn-1次元視覚による観察の場合、(n-1) 次元オブジェクトの1次元配置を検討することになる(ようだ)
  • 1. イントロ
  • 2. 形とLandmarks
    • 形とは
    • Landmarkとは:集団間・集団内のオブジェクトの上にあって、対応付けされる点のこと
      • 解剖学的Landmarks:知識ドリブン(乳幼児には無理)
      • 数学的Landmarks:形ドリブン(理論は乳幼児には無理だけれど、神経系には可能)
      • Pseudo-landmarks:補間点とか
  • 3. 形の配置
    • 形は等長変換・均等スケール変換によって変わらない性質なので、逆に言えば、うまいこと等長変換してスケール調整してやらないと、異同を検討しにくい。そのための「配置」の仕方がProcrustes anaylsisのやってくれること
    • Shape Space:問題となる(問題とする)すべての形を扱う空間のこと
    • k次元オブジェクトをn個のLandmarks点で扱うとすると、Shape Spaceの次元はM=kn-k-1-\frac{k(k-1)}{2}なのだと言う
    • Shape Spaceに合って形の集合はリーマン多様体を構成して、そこに測度が入る。ハウスドルフ距離やらstain energyやらProcrustes distanceやらがそれらの例
    • Procrustes distance
      • 形を表す点のセットが2セットあるときに測れる距離
        • 重心をとって
        • 形の「大きさ」によりスケールを調整して
          • 「大きさ」の定義が要る
        • 2つの形の位置を重心で揃えて
        • 回転させる
          • Singular Value Decompositionベースで位置をそろえる
    • たくさんの像があったときにその「コンセンサス・平均」をとるのは、仮平均を決めて、それに合うように配置をそろえながら平均を更新して収束させる
    • 接空間に像を作ろう
      • スケールをそろえるということは多次元球面上の点として像を配置しようということだが、それだと不都合もあるので、仮平均をとったらその接平面に射影してから考えてみよう、という話
  • 4. 形のバリエーションをモデル化する
    • レファレンスの役割をする形(単位としての形)
    • 単位としての形の組合せとしての形モデル
      • PCAが使える
  • 5. やってみよう
  • 6. 結語