Part I(基礎)1統計学 ぱらぱらめくる『Algebraic statistics for computational biology』
Algebraic Statistics for Computational Biology
- 作者: L. Pachter,B. Sturmfels
- 出版社/メーカー: Cambridge University Press
- 発売日: 2005/08/22
- メディア: ハードカバー
- 購入: 1人 クリック: 9回
- この商品を含むブログを見る
統計学 | 代数幾何学 |
---|---|
独立 | Segre variety |
log-linear model | toric variety |
curved exponential family | manifold 多様体 |
mixture model | join of varieties |
MAP estimation | tropicalization |
... | ... |
- 1.1 離散データの統計モデル
- 代数統計モデルはd個の説明変数の(d次元)空間と状態空間(m次元空間、もしくは空間)とを対応付ける多項式関数と考える
- 尤度関数は統計モデルの部品である確率密度関数のパラメタと観測値(状態空間の値)とでできている。色々なことを観測してもよいけれど、色々な側面を観測すればするだけよい、というわけではなく、これを観測しておけば尤度の計算は可能、という観測量(統計量(スカラーだったりベクトルだったり))がある(十分統計量)(2項分布をモデルとしているときに、N回中n回、成功した、ということを観測すれば、それで十分)
- 1.2 線型モデルとトーラスモデル
- 1.3 EM(Expectation-Maximization)
- 線型モデル、トーラスモデル以外のモデルでは、最尤推定が単純な頂上探索では見つからない
- そのような場合によく用いる方法がEM法
- たいていの場合は極大に収束する(ときにそうならない)
- 2種類のステップE,Mがある。それを交互に繰り返す
- 1.4 マルコフモデル
- 1.5 グラフィカルモデル
- グラフィカルモデルというより、木を含めた「グラフ」上での遷移を扱うモデル、ということ(?)
- 統計モデルをd個のパラメタ空間からm個のパラメタ空間のマップとして扱い、その上の制約の集合のこととなる
- 離散を扱うのでグラフ上に表せる