2次元空間データの記述統計
- データは1次元空間にある複数の0次元多様体の2次元座標情報
- 背景にあると思っている、そして思い描きたいのは、2次元空間の点に(0以上の正の)値を与えて定まるもので、それは3次元空間に曲面として描かれる2次元多様体
- この2次元多様体には、(比較的よく使う場合として)確率密度分布に相当するものがある。1次元の場合によく使う累積密度分布は普通の意味では取れないのだが、どうしてもできなのかどうかはわからないので、いまのところは保留にしておく
- 2次元空間データの記述統計は、この3次元空間上の2次元多様体に関する、スカラー値、スカラー値のセット、スカラーの値のペア・スカラーの値のトリオ、またペアのセット・トリオのセット、と言ったところだろう。さらにまた、スカラー値、スカラー値のペア・トリオが0次元多様体であるとして(次元数が足りないときは、数直線軸や平面に張り付いているものと考える)、1次元多様体や2次元多様体を「記述統計量」の構成要素として、そのセットを考えることもできる
- k次元多様体を「記述統計量」とするには、「k次元多様体を把握できる視覚系」が必要。そんな感じで展開したい
- 系列で考えてみる
- 平均値・モーメント系列
- 平均は「重心」
- モーメントは「重心」の周りに定義できている
- 分布の峰の数には(少なくとも比較的)無関心
- 中央値・クオンタイル系列
- 特定の順序づけルールがあれば、それに関する中央値が定まるのは問題ない。中央を「順序」に依存したものとみなすということになる。そのような「中央2次元座標」が複数の順序づけルールについて一つに決まるのであれば、それが「中央」
- 2次元空間における「順序」とは(連続なそれならば)、等高線を引くということで、それによってクオンタイル値が等しい場所は等高線という1次元多様体に相当してくる
- 原理的には可能だが、利用は難しそう
- 最頻値・峰・谷・勾配・極値・変曲点の系列
- 平均値・モーメント系列
- 主な特徴となる多様体の次元