1.概論 駆け足で読む極値統計



  • 統計学者には2種類。middle manとtail man
  • Fisher & Tippette
  • 極値分布には3種類
    • (逆)ワイブル分布
    • グンベル分布
    • フレッシェ分布
  • 極値分布への吸収と吸引領域
    • 正規分布極値分布への収束が遅い
    • ほとんどの連続分布は極値分布の吸引領域に属する
      • (逆)ワイブル分布の吸引領域に属する連続分布:一様分布、ベータ分布
      • グンベル分布の吸引領域に属する連続分布:正規分布、ワイブル分布、ガンマ分布、対数正規分布
      • フレッシェ分布の吸引領域に属する連続分布:t分布、パレート分布
    • 分布関数が極値分布の吸引領域に属するための必要十分条件
  • Peaks over threshold解析
    • 極値データのみでなく、ある閾値以上の値を使う
  • 一般パレート分布
    • ある閾値以上のデータの分布が指数分布で近似できるという経験則を裏付けたのが一般パレート分布
  • 極値分布がベータ分布で近似されるなら安全、指数分布なら要注意、パレート分布なら危険』
  • 極値分布への収束は一般に遅い、安定分布への収束も遅い』
  • 補足(2007.03.21)
    • あるデータがある。そのユニットごとの極値を集めると、それは極値分布となる。極値分布を近似するには、一般化極値分布で母数推定する
    • そのかわりに、あるデータの閾値以上の値を集める。すると、それは、閾値超過分布となる。この閾値超過分布の母数推定をしてもよい。極値分布が一般化極値分布に近似できるとき、閾値超過分布は一般パレート分布となるので、一般パレート分布の母数推定をする、という方法もある
    • 一般化極値分布の母数と一般パレート分布の母数との間には、関係がある