ぱらぱらめくる『Topological and Statistical Methods for Complex Data』

  • Preface
    • データが大規模化し、高次元化する中で、すべてのレコードをみっちり扱う(すべてを座標化するように)のではなく、全体の連なり具合のようにする(距離より位相)ことで、大きすぎてうまく行かないデータセットを何とかしよう、というのが大まかなコンセプト
  • Part I Large-Scale Data Analysis: In-Situ and Distributed Analysis
    • A Distributed-Memory Algorithm for Connected Components Labeling of Simulation Data
    • In-Situ Visualization in Computational Fluid Dynamics Using Open-Sourse tools: Integration of Catalyst into Code_Saturne
    • Sublinear Algorithms for Extreme-Scale Data Analysis
      • データセットが時空間的に大規模化して、I/Oがネックになっているが、そのための対処
      • データ全部を見ないで済ます。結果として、O(n)より軽くなる(sublinear : O(n)がlinear)
      • 膨大なデータ量→引き出したい答えは全部使わなくても出るでしょう→問題はどうやってはしょるか(はしょった上で答えが全部使ったときと同じならよし)
      • たとえばの解説サイトはこちら
  • Part II Large-Scale Data Analysis: Efficient Representation of Large Functions
    • Optimal General Simplification of Scalar Fields on Surfaces
      • 空間にスカラー場があると、それは等高線図のようなものとなる。その分布の描く絵模様を取り出したい
      • contour treeと言う方法がある。こちらのように地図の等高線のトポロジカル構造を木構造として取り出す。Reeb graphというのもあって、こちらのように多様体上の実関数スカラー場からグラフを取り出す。Morse-Smale complexというのもあって(こちら)、これは多様体上の実スカラー場に勾配ベクトル場を出す
      • どんな多様体が来ても、同じアプローチでやるにはどうするか、というのが、この章の"General Simplification"のイワンとするところ
      • 頂上、谷底、峠(サドル)をどうやって決めて、それらをどうやってつなぐか
    • Piecewise Polynomial Monotonic Interpolation of 2D Gridded Data
      • 形を維持して、補間する(Shape-preserving interpolation)に似ている
      • Monotone 制約を入れる。1次元なら(まあ)簡単だが、2次元にすると…という話(らしい)
      • 地形図ができる
    • Shape Analysis and Description Using Real Functions
      • 3D物体が持つ二次元表面の取り扱い
  • Part III Multi-Variate Data Analysis: Structural Techniques
  • Part IV Multi-Variate Data Analysis: Classification and Visualization of Vector Fields
    • Lyapunov Time for 2D Lagrangian Visualization
      • 速度ベクトル場が時間変化しているときに、「動きの軌跡」を描図するのがLagrangian visualizationらしい
      • 軌跡なので、どのくらいの時間分を表示するかを決めないといけないが、定幅時間にする、というのは一つのやり方だが、予測が難しい非線形現象なので、予測できる範囲で、と言う意味でLyapunov時間を使ってやるとどうなる?そのためにはどうする?という話
    • Geometric Algebra for Vector Field Analysis and Visualization: Mathematical Settings, Overview and Applications
      • 幾何代数を使ってみよう、というはなし
    • Computing Accurate Morse-Smale Complexes from Gradient Vector Fields
  • Part V High-Dimensional Data Analysis: Exploration of High-Dimensional Models
    • Exercises in High-Dimensional Sampling: Maximal Poisson-Disk Sampling and k-d Darts
      • 均一にサンプリングするときには、サンプリング領域に形がなければ、一様分布的に、サンプリングすればよいけれど、そうでないとすると、あるサンプリング箇所(小領域)と隣接小領域との重複関係が変わるのでそれを調整しながらのサンプリングにしないといけない、その方法
    • Realization of Regular Maps of Large Genus
      • 規則正しいタイリングも貼り付け対象の形で難しくなる
      • 対称性〜群論を使っう
  • Part VI High-Dimensional Data Analysis: Analysis of Large Systems
    • Polynomial-Time Amoeba Neighborhood Membership and Faster Localized Solving
      • 連立多項式の解を空間的にとらえ、その近似解(範囲)を求める話
    • Slycat Ensemble Analysis of Electrical Circuit Simulations
      • 複数のシミュレーションを合わせる話。パラメタの異同とシミュレーション結果の異同との突合せ
      • コンピュータシミュレーション実験的な、条件-出力関係の推定・検定へ