パラパラめくる『統計学を哲学する』

  • データを取って、手法を適用して、その結果を使う(検定する、推定する、予測する、論文に根拠として書く)とき、統計学・データサイエンスは、何をしてくれているのだろうか、と言うことを、いわゆる帰無仮説検定・ベイズ推定・モデル選択・過学習防止・深層学習/AI、因果推論に渡って、どれにも重きを置かずに(置かないように気を遣ってあることが強く感じられる書き方で)書かれた本でした
  • データを手法でいじるけど、結局、何を自分は言いたいの・・・と言うことに疑問を持っているときに読むと、色々な視点から、未解決問題やその例も含めて、理解が進むと思います
  • 目次
    • 序章 統計学を哲学する?(3本柱としての、存在論・意味論・認識論)
    • 第1章 現代統計学パラダイム
      • 記述統計(データと記述統計、経験主義、実証主義
      • 推測統計(確率モデル、統計モデル)
    • 第2章 ベイズ統計
    • 第3章 古典統計
      • 頻度主義の意味論
      • 検定
      • 古典統計の哲学的側面(帰納行動、外在主義的認識論、認識論としての古典統計)
    • 第4章 モデル選択と深層学習
      • 最尤法とモデル適合
      • モデル選択(AICとその哲学的含意)
      • 深層学習
      • 深層学習の哲学的含意(プラグマティズム認識論、徳認識論)
    • 第5章 因果推論
      • 規則説と回帰分析
      • 反事実条件アプローチ
      • 構造的因果モデル
      • 統計的因果推論の哲学的含意
    • 終章 統計学存在論・意味論・認識論(統計学の扱う対象としては何が「存在」し、それは、現実世界・利用現場では何を「意味」し、データへの統計学・データサイエンス手法の適用から、何を知るのか、「認識」するのか
  • 用語集
    • 存在論・意味論・認識論
    • 統計量、標本、多変量統計量
    • 実証主義、理解できるような法則としてまとめる、思考の経済、記述統計、恒常的連結(因果の直接的発生源ではなく)
    • 経験主義、実証主義帰納、自然の斉一性
    • 推測統計、確率モデル、確率論、母集団、標本空間、事象、確率・条件月確率、独立・従属、全確率・周辺化、ベイズ定理、確率変数・確率分布、同時確率分布、周辺確率分布、確率密度・確率密度関数、期待値・母平均・母分散、IID (independent and identically distributed)、大数の法則中心極限定理、推定量、確率収束、統計モデル、パラメトリック統計・分布族、「確率種」
    • ベイズ統計と主観・信念の度合い、尤度・事前確率・事後確率、仮説の確証と反証、パラメータ推定、予測、事後予測分布、機能論理、正当化された真なる信念、認識論的内在主義、真理促進的・遡行問題、基準率の誤謬、基礎付け主義、無差別の原理・無情報事前分布、経験ベイズ、主要原理、参照クラス、モデルチェック、仮説演繹法デュエムクワインテーゼ、認識論的全体論
    • 頻度主義、蓋然的仮説の反証、反証主義帰無仮説・対立仮説、帰無仮説、第1種過誤・第2種過誤、有意水準・サイズ・検出力・p値、検定と帰納行動、外在主義的認識論、信頼性主義、ゲティア問題、ノージックの追跡理論、信頼性主義的正当化、反事実的、可能世界意味論、p値問題、再現性の危機、多重検定、p-hacking、停止規則問題、一般性問題
    • 最尤法、最尤推定量、対数尤度、モデル適合、学習、適合モデル、最小二乗法
    • 回帰、説明変数、目的変数、モデル選択、過適合・過学習赤池情報量基準、プラグマティズム、統計的一致性
    • 深層学習、多層ニューラルネトワーク、誤差函数、誤差逆伝搬法、勾配消失問題、正則化
    • プラグマティズム認識論、真理から予測へ
    • 自然選択と試行錯誤による最適化、敵対的生成ネットワーク(GAN)、徳認識論(能力に基づいて得られる認識に対する尊重、の、ようなもの)、敵対的事例、動物的知識・反省的知識、説明可能な人工知能、表現学習・転移学習、翻訳の不確定性
    • 統計的因果推論、規則説、交絡要因、条件付き独立、共変量、反事実条件説、仮説検定と因果推論、仮想結果、無作為化、因果推論の根本問題、潜在結果、平均処置効果、無作為化比較試験、強く無視できる割り当て条件、傾向スコア、反実仮想モデル、構造的因果モデル、因果グラフ、有向分離、因果的マルコフ条件、構造方程式、介入、バックドア基準、因果探索、忠実的条件、被覆法則モデル、三元論的な存在論ベイズネット、因果種