2021-05-14

ぱらぱらめくる『Algebraic Statistics in Practice: Applications to Networks』

ぱらぱらめくるシリーズ代数統計ネットワーク系統樹因果関係

arxiv.org

このペイパーでは
- Algebraic が：algebras, geometry, combinatorics　を指し、それらを使う統計手法を扱う
- Networksは：３つの例を扱う。Relational models, Causal structure discovery, Phylogenetics
- Applications として：Statistical achievements, Practical relevance の側面に焦点を当てる
1 Introduction
- 代数統計学の背景
  - 最小二乗法に基づく統計手法は、非常に広く用いられているが、それは連立線形方程式に基づく手法。これも「線形代数手法」と言えば、言える
  - 非線形な代数がそれに対比される形で現れた。対称性とか実験計画法とかを指す(？）。これらは「代数統計手法」とも言える
  - 指数型分布族に基づく手法もあり、これは凸性という幾何学的特徴に強く依存している。凸制約のある状況での関数・微分などに基づくものなので、そのような関数の代数を考えれば、代数統計ではあるが、『代数統計』と言うときには、解析的関数の代数以外を指して言うことが多いので、以下が対象となる
  - これらを経て、(計算能力の向上ともあいまって)登場しているのが、「(本ペイパーで扱う)代数統計手法」
- ３つのネットワークの特徴づけ
  - Relational models
    - 多要素の関係の有無・強さが観測される。その観測が、特定のネットワークモデルを設定し、それと合致するかどうかを検定する
  - Causal structure discovery
    - ネットワークは与えられるのではなく、データから見つけ出したい。「ネットワークとは要素と要素とのつながり～エッジである」とみなせば、このアプローチでは、頂点についての観測がなされ、それに基づきエッジのセット(とその重み)を見つけ出すことに相当する
  - Phylogenetics
    - これもグラフを見つけだす問題だが、見つけるべきグラフは木であって、その木のノードには、「観測対象である葉ノード」と「観測されない節・根ノード」とがあるという特徴がある
2 Relational models
- このモデルでは、ノード数が固定されたグラフのうち、特定の指標のセットが条件を満足するグラフをランダムに発生させる「ランダムグラフ」によって、「条件付きグラフ集合分布」を作成する。このためには「ランダムグラフ」の作り方を定める必要になる。その作り方も色々ある
- このペイパーでは、指数型分布族表現を持つランダムグラフモデルである"exponential family models of random graphs"に基づいて話を進めている
- exponential... とは、グラフを特徴づけるベクトル(十分統計量のセット)と、そのベクトルの要素ワイズの重みとの内積の指数関数に比例する確率を用いる。ここで要素ワイズの重みが分布の「θ座標」になる
- 検定には２種ある
  - Heuristic tests
    - 生成グラフ分布における観測グラフの外れの程度を定量する方法だが、外れの程度を測る指標の分布の素性が不明であるし、ネットワークの特徴ベクトルの選び方がarbitraryであるという問題がある
  - Asymptotic tests
    - ランダムであることにiidを仮定することが漸近近似では要求されるが、エッジのありなし・重みは、相互に独立にはできないので、そぐわない
    - 限定的なネットワーク形状・モデルでは漸近近似ができる統計量が知られていたりするが、一般化はできていない。特に疎グラフに合致しない(らしい)
- p個のノードにk変数のペアワイズ関連・遠近観測を行うと、 $p \times p \times i_1 \times ... \times i_k$ なる多元表になる。この多元表のセルは「ノードペア」の情報
- この多元表が求めるexponential random graph modelを表していると考えると、log-linear-ERGMになると言う
- 頂点次数を保存してグラフを改変する動きを、頂点ペア～辺の組(それを積にする)の加算・減算で表して、「代数化」する
3 Causal structure discovery
- DAG (Directed Acyclic Graph)。そのノードは観測される変数
- DAGの構造に応じて、変数の値の取り方に確率モデルを入れる。最も単純には変数間の関係に線形式を、乱雑項に正規乱数を取る
- 条件付き依存度 Conditional Independence (CI)に基づく変数(ノード)間の関係を導く。CI relationは、DAGの部品のようなものなので、それを組み合わせて、作りうるDAGはたくさんある。その際に用いられるのがMarkov property。そこからDAGを導く
- 完全グラフからスタートしてCIによりグラフを成型する。そのときにルールが必要で、そのルールがfaithfulであることを保証するのが実代数幾何の等式・不等式。その意味で「代数統計」
- Permutohedron とか Associohedronとかが出てくる
4 Phylogenetics
- 隠れたノードを含めて木のトポロジーの全体
- それらが、塩基の入れ替わりという「計算～代数」で繋がっている
- 尤度平面のglobal optimumや特異点についての情報を取り出すのにcomputational algebraが用いられる
- "Maximum likelihood estimation in statistics leads to the problem of maximizing a product of powers of polynomials.こちらのペイパーより" というような話と関係する
- データに基づいて、「よさそうな木トポロジー」を見つけたい

2021-05-12

ぱらぱらめくる『量子確率論への招待』

量子確率論パラパラめくるシリーズ正規分布半円分布酔歩格子木 C*-環

http://www.math.is.tohoku.ac.jp/~obata/research/file/1996-Nagoya-Forum.pdf

測度論的確率論は $(\Omega,F,P)$
量子論的確率論はC*-確率空間で $(A,\phi)$ 、Aが可換環なら古典論、Aが非可換環なら量子論
確率分布はモーメント列で(だいたい)決まる
量子確率論ではグラフを考える。グラフの頂点は群の集合の要素。グラフの「辺による移動」も群の集合の要素。ある頂点からある辺によって移動して別の頂点にたどり着くことは、群の二項演算によって表せるから、グラフ構造は群の幾何的構造と見える
各頂点に、「辺に相当する要素」を掛けて、(いくつかの)隣接頂点に移動することを考える。これをすべての頂点における「量子確率状態」の「確率推移」とみなすと、「辺に相当する要素」について、特定の１つの移動ではなくて、可能なあらゆる移動をすることを考えると、それは量子状態の言葉でいうと、ユニタリ作用
したがって、グラフ上の確率的な移動の全体(酔歩)の様相は量子確率ベクトルとユニタリ作用素で定義できる
今、ある頂点を原点とすると、「n次モーメント」は原点からn歩で原点に戻る道の数に比例することが示せる
その考えで行くと、格子グラフ(可換群 $Z^N$ )の場合のモーメント列の極限が、古典的な正規分布のモーメント列と一致する。また、k-分岐木(自由群 $F_N$ )のモーメント列の極限は、量子確率論でよく出てくる半円分布のモーメント列と一致する
この原点に戻って来る道の数え上げにあたって、自由群の場合にカタラン数が出てくるが、それを考えるときに、k本の一時独立なベクトルに関して、順方向と逆方向のそれが同じ回数ずつ現れること、その現れ方に非交叉対分割制約があることを使うことなどが登場する
気になったこと。閉じたグラフの辺ベクトルの制約にこの非交叉対分割があらわれるべきことと、戻って来る道の数とグラフのゼータ関数には関係があることの２つ。

2021-05-08

Boundary measurement mapの統計学的意味合い

Boundary measurement map Grassmannian グラフ Plabic graph Grassmannian graph 行列式 Determinant Total positivity Perfect orientation 団代数平面グラフ

arxiv.org

このペイパーでは、平面有向グラフ(ネットワーク)をPositive Grassmannian上の１点に対応付ける話をしている
平面有向グラフをPlabic graphと呼ばれる(無向で頂点が２タイプのグラフを円板内に配置したもの)に対応付けたり、さらに、Grassmannian graph(頂点タイプを２タイプではなく、もっと一般的にしたグラフ)に対応付けたりして、組合せ幾何的な取扱いをする話などがあったり、面白いのだが、その側面とは違う面～統計学的な意味合い(込み入った情報を持っていそうな対象を簡潔な表現にまとめ上げる)として、どう考えるかについて、メモしておきたい
平面有向グラフＧがある。頂点数|V|とする。周辺頂点数 Nb,内部頂点数 Ni とする。|V| = Nb + Ni である。
今、Ｇには、ある自然数 k ( $k \le Nb$ ) が取れて、 $k \times Nb$ 行列 M が与えられるという。
この行列Ｍについて、Nb個の列から、k列を取り出す場合の数は、 $d = \begin{pmatrix} Nb \\ k \end{pmatrix}$ 通りあるが、このd通りの $k \times k$ 行列の行列式を連ねたものをPlucker 座標と言い、Mを $d$ 次元空間の点(斉次座標になっているので自由度はd-1に減るが…)とみなすことができる、という。
この空間をGrassmannianと言う。Nb,kがGrassmannianの種類を定めるので $Gr(k,n)$ と書く。
これにより、Ｇを $Gr(k,Nb)$ 上の点とみなすことができる。
今、Ｍの要素の与え方に、あるルールを入れると、Plucker座標のすべての値が正になるので、Positive Grassmannian上の点とみなせる。逆にPositive Grassmannian上の点には、Nb,kを満足するグラフ表現も取れるのだと言う。
これにより、色々なGのGrassmannian上での相互位置関係がハンドリングできるようになるという、「嬉しさ」がある。これは統計学的に嬉しいことである。
もっと嬉しいことがある。
Gは $d = \begin{pmatrix} Nb \\ k \end{pmatrix}$ 個の座標で表せているし、 $Nb \times k$ 個の行列要素をその矩形の然るべきセルに置くというルールを付加すれば、d個の値で表せている。
さらに、Gの内部頂点(内部頂点は、その１頂点とそれに接続する辺とに着目することで、平面グラフとみなせる)ごとに、それに対応するGrassmannian上の座標(Plucker座標や、その情報を背負った行列表現)が付与できるが、Gのd個のPlucker座標は、この内部頂点のPlucker座標を用いて計算するルールがある。
そして、その計算ルールには、Ｇの有向グラフとしての構造が反映される。
これらのことは、Gの簡潔な表現として、Ｍやそれに定まるPlucker座標があるが、その完結表現が、Gの内部のピースの情報とGの構造とに関する情報を反映していること、また、それらをまとめ上げるルールが、Gに完結表現を可能にしている、ということを意味する。
「情報量の多い対象」に「モデルの族」という枠組みを与え、そのモデルの族の下で「特定のパラメタ値(のセット)」によって、特定のモデルによって説明する、ということに見える。
ちなみに、Gの内部の頂点に対応するGrassmannianもPositiveであるし、Gの内部の部分を取り出したサブグラフについてもPositive Grassmannianが対応するという意味で、「Total Positivity」がある
このTotal positivityを支えるのは、「引き算を含まない」関係式がGとそのサブグラフに付随するPlucker座標(という小行列式)に成り立つという背景関係である。
小行列式同士の関係に「引き算を含まない」関係式が成り立つことから、この情報集約は行列式を用いて構成されるが、「引き算を含まない」関係式で要素同士が繋がっている場合には、同様の「全体はたくさんだが、その部分を確定すると、全体が確定する」、しかも「total positive」という関係が得られる。
これが団代数と団変数で説明される(ことが多い？)。

2021-03-18

ニューラルネットワークでのトロピカル幾何

ニューラルネットワークトロピカル幾何トロピカル代数 ReLU

arxiv.org

この論文では、ニューラルネットワークでのactivation function をReLUに絞っても、まあ大丈夫、との判断の下、ReLUに絞った上で、ニューラルネットワークの入力から出力への変換がトロピカル幾何・トロピカル・有理関数で表現されることを説明している
ごく大雑把に言うと、ニューラルネットワークが作るモデルは非凸な多面体になるが、それは、凸多面体の差として関数表現されるが、この「関数の差」がトロピカル関数で言うと、関数の比になるので、トロピカル有理関数になる、と、そういう話
ReLUという活性化関数は、ニューラルネットワークで用いる活性化関数の１つだが、これに限定して話を進めても、ニューラルネットワークがどうしてうまく機能するのか、ということの本質的な議論にはある意味では大きな違いが生じないとみなす立場も取れる、ということで、ReLUに限局して話を進めている
ちなみに、ReLUという関数は、ある値より小さいときはゼロ、ある値から大きくなると、一次増加関数になるような関数だが、それは、 $max(ax+b, t)$ に相当し、これはトロピカル幾何では $(ax+b) \oplus t$ に相当するから、トロピカル関数と相性がよい：参照→

www.atmarkit.co.jp

ニューラルネットワークにより、d次元ベクトルが、p次元ベクトルに変換される
それを $y=(y_1,...,y_p) = max(A x + b,t)$ , $x = (x_1,...,x_d)$ と書くことにする。Aは $p \times d$ 行列であり、bは長さpのベクトルである
ここで、行列Aを、正の成分の部分と負の成分の部分とに分けて、 $A = A_{plus} - A_{minus}$ とする。このとき、 $A_{plus}$ も $A_{minus}$ も非負行列になっている
このとき出力 $y = max(Ax+b,t)$ は $max(A_{plus}x +b, A_{minus} x + t) - A_{minus}$ になるという
こういう分解は、いかにも、トロピカル関数的。なぜなら、max()関数を使っているし、行列はすべて非負成分だし、max() の項と $A_{minus}$ の項の引き算は、トロピカル有理関数に相当するから
とは言え、 $max(Ax+b,t) =max(A_{plus}x +b, A_{minus} x + t) - A_{minus}$ と言われても、え、ほんと、という感じがするので、手計算して正しいことを確認してみる

p <- 8
d <- 10

A <- matrix(rnorm(p*d),ncol=d)

x <- rnorm(d)

b <- rnorm(p)

t <- rnorm(1)

y <- A %*% x + b

y. <- apply(cbind(y,rep(t,p)),1,max)

Aplus <- A
Aplus[which(Aplus < 0)] <- 0

Aminus <- A
Aminus[which(Aminus > 0)] <- 0
Aminus <- - Aminus

#Aplus
#Aminus

range(A - (Aplus - Aminus))

y.. <- apply(cbind(Aplus %*% x + b, Aminus %*% x + t),1,max) - Aminus %*% x

#y.
#y..

range(y. - y..)

2021-02-14

Overleaf用にpubmedからcitation 情報を取り出す

Overleaf てふ pubmed 引用文献 citation

Overleaf

qiita.comは、オンライン上でLaTex文書を作るサイト

テンプレートもたくさんあるので便利
LaTexなので引用文献も

\cite{Yamada2020}

と文中に書き込んでおいて、引用文献を書きたい場所に

%This is where your bibliography is generated. Make sure that your .bib file is actually called library.bib
\bibliography{library}

%This defines the bibliographies style. Search online for a list of available styles.
\bibliographystyle{abbrv}

のようにしておき、library.bibなるファイルを置いておき、Yamada2020に対応する情報を、然るべき体裁で張り付けて置けばよい
そのしかるべき体裁をpubmedからひょいっと取って来るには、pubmedIDを確認し、このサイト

www.bioinformatics.orgのクエリにpubmedIDを入れて検索の上、 incl. abstract　オプションで exportすればよい

% 32275673
@Article{pmid32275673,
Author="Okada, D. and Yamada, R. ",
Title="{{D}ecomposition of a set of distributions in extended exponential family form for distinguishing multiple oligo-dimensional marker expression profiles of single-cell populations and visualizing their dynamics}",
Journal="PLoS One",
Year="2020",
Volume="15",
Number="4",
Pages="e0231250",
Abstract={Single-cell expression analysis is an effective tool for studying the dynamics of cell population profiles. However, the majority of statistical methods are applied to individual profiles and the methods for comparing multiple profiles simultaneously are limited. In this study, we propose a nonparametric statistical method, called Decomposition into Extended Exponential Family (DEEF), that embeds a set of single-cell expression profiles of several markers into a low-dimensional space and identifies the principal distributions that describe their heterogeneity. We demonstrate that DEEF can appropriately decompose and embed sets of theoretical probability distributions. We then apply DEEF to a cytometry dataset to examine the effects of epidermal growth factor stimulation on an adult human mammary gland. It is shown that DEEF can describe the complex dynamics of cell population profiles using two parameters and visualize them as a trajectory. The two parameters identified the principal patterns of the cell population profile without prior biological assumptions. As a further application, we perform a dimensionality reduction and a time series reconstruction. DEEF can reconstruct the distributions based on the top coordinates, which enables the creation of an artificial dataset based on an actual single-cell expression dataset. Using the coordinate system assigned by DEEF, it is possible to analyze the relationship between the attributes of the distribution sample and the features or shape of the distribution using conventional data mining methods.}
}

のように返って来るので、識別子の行 "% 32275673 "を削り、

@Article{pmid32375029,

の部分を、LaTex本文の記載に合わせて

@Article{Yamada2020,

と書き換えれば出来上がり
もちろん、書き換えずに、pubmedIDのまま、LaTex本文で引用しておけば、その書き換えの手間も不要

2021-01-28

グラフラプラシアンとPCAと固有値分解

グラフスペクトルラプラシアン PCA 固有値分解

点集合の座標が行列Xとして与えられているとき、そのペアワイズ内積行列 $P =X^TX$ は対称行列であり、それを固有値分解し
回転行列Vと非負固有値を対角成分とする対角行列 $\Sigma$ とを使って
$P = V \Sigma V^T$ と分解できる
これは、点をVで回転して $P = X_{new}^T X_{new}$ となるような $X_{new} = \sqrt{\Sigma} V^T$ なる、新しい座標を点に与え、その配置が、分散の観点で整然とした状態になるようにすること、と説明される。
一方、単純無向グラフには、ラプラシアン行列Lなるものがさだまる
Lはその対角成分がグラフ頂点の次数であるような行列Dと、グラフの隣接行列Aとを使って $L = D - A$ として与えられる
Lも対称行列であり、固有値分解すると、回転行列と固有値を対角成分とする対角行列の積に分解できて、行列Xの場合と同様に、グラフの各頂点に座標を持たせたとみなすことができる
いわゆるPCAでは、大きな固有値に対する固有ベクトルが与える座標軸は、点の存在状態をおおまかにとらえる力が大きい
他方、グラフラプラシアンの場合には、小さな固有値に対する固有ベクトルが与える座標軸が、グラフをおおまかに分ける力が大きい
ちなみに、連結グラフのラプラシアンの固有値の１つは０で、それ以外はすべて正であることが知られている
PCAの固有値の働きとグラフラプラシアンの固有値の働きが、大小に関して逆転していることを解消することにする。それによりグラフにとっても何かしらの対称行列があり、その固有値分解が、頂点に座標のようなものを与え、値の大きい固有値に対応する軸がそのグラフ頂点のばらつきを大まかに説明するような、そんな構成にしたい
グラフラプラシアンを離れて、正定値対称正方行列　Q　を考える
Qには逆行列が存在するとして、それを $Q^{-1}$ とする
今、Qを固有値分解すると、 $Q = V \Sigma V^T$ となるとする。ここでVは回転行列であり、 $\Sigma$ は対角行列ですべての対角成分が正である
Vは回転行列であるから $V^T = V^{-1}$ である
実は、 $Q^{-1} = V \Gamma V^{-1}$ となる。ただし、Vは回転行列でQを固有値分解したものと同じであり、 $\Gamma$ は対角行列であり、その値はすべて正で、かつ、 $\Sigma$ の大きい順にi番目の固有値と、 $\Gamma$ の小さい順にi番目の固有値との積は、i=1,2,....のすべてのiについて１になる

# 適当に正定値対称行列を作る
library(GPArotation)
n <- 5
# 回転行列
V <- Random.Start(n)
# 正固有値となるように正成分の対角行列
Sigma <- diag(runif(n)*5)
# 正定値対称行列
Q <- V %*% Sigma %*% t(V)
# その逆行列
Qinv <- solve(Q)
# 固有値分解する
eout.Q <- eigen(Q)
eout.Qinv <- eigen(Qinv)
# 固有値のセットを昇順・降順を入れ替えて掛け合わせると、すべて１
eout.Q[[1]] * eout.Qinv[[1]][n:1]
# 固有値ベクトルは、符号の入れ替えが起きるので、すべての固有ベクトルが、一致しているか、符号違いで一致しているかを以下の式で確かめる
# 全成分がゼロになるので、固有値ベクトルが同じになっていることがわかる
(eout.Q[[2]] - eout.Qinv[[2]][,n:1]) * (eout.Q[[2]] + eout.Qinv[[2]][,n:1])

つまり、正定値対称行列の固有ベクトルと、その行列の逆行列の固有ベクトルは等しいことがわかる
ただし、片方で大きい固有値に対応する固有ベクトルが、逆行列では小さい固有値に対応する固有ベクトルである、という対応関係にある
したがって、ラプラシアンの0でない最小固有値に対する固有ベクトルは、ラプラシアンの逆行列の、2番目に大きな固有値に対応する固有ベクトルに一致する
ちなみに、連結グラフのラプラシアンは１個の固有値を持つ。それに対応する「ラプラシアンの逆行列」の固有値は無限大となる
このことから、実際には、ラプラシアンの逆行列を計算することはできないが、ラプラシアンの逆行列の大きな固有値に対応する固有ベクトルを求める代わりに、ラプラシアンの小さな固有値に対応する固有ベクトルを求め、その固有ベクトル軸が重要である、と言っている
さらにちなみに、ラプラシアンの固有値ゼロに対応する固有ベクトルというのは、すべての成分の値が等しいベクトルのことである。逆に言うと、ラプラシアンの逆行列が取り扱えるとして、最大固有値に対応する固有ベクトルも、すべての成分の値が等しいベクトルになる、と言っている
今、PCAでは点をうまくばらつかせることを目指しており、ラプラシアンの固有値分解で得る固有ベクトルにもその役割を持たせようとしているわけなので、すべての頂点の座標が同じになるような固有値に興味はないから、ラプラシアンの逆行列の2番目に大きな固有値＝ラプラシアンの2番目に小さな固有値が、頂点座標を決めるうえで最もおおまかな情報を持っていることになる
グラフラプラシアンの逆行列は「無限大の固有値」を持たせる必要があるので、作れないが、「十分大きな固有値」を持たせることで近似することにすれば、以下のようになる

# 適当に単純無向グラフを作り
library(igraph)
n <- 7
A <- matrix(sample(0:1,n^2,replace=TRUE,prob=c(0.7,0.3)),n,n)
A <- A + t(A)
diag(A) <- 0
A <- sign(A)
g <- graph.adjacency(A,mode="undirected")
plot(g)
# ラプラシアン行列を作る
L <- diag(degree(g)) - A
# ラプラシアン行列を固有値分解する
eout <- eigen(L)
# 固有値ベクトルの束の行列と固有値を対角成分とする対角行列とでラプラシアン行列を再計算してみる
eout[[2]] %*% diag(eout[[1]]) %*% t(eout[[2]]) - L # essentially zero
# ラプラシアン行列の逆行列は０なる固有値があるのでうまく行かない
#Linv <- solve(L)
# 0の固有値に対応させて大きな正の値を、非0の固有値に対応させて、その逆数を固有値とし
# 固有値ベクトルはラプラシアンのそれをそのまま用いて
# ラプラシアンの逆行列の近似行列を作る
Linv. <- (eout[[2]]) %*% diag(c(1/eout[[1]][1:(n-1)],10^8)) %*% t(eout[[2]])

# ラプラシアンの逆行列を固有値分解してやる
einvout <- eigen(Linv.)
# ラプラシアンの固有値と
# ラプラシアンの逆行列の固有値とは相互に逆数になっている
eout[[1]] * einvout[[1]][n:1]
# ラプラシアンの固有値ベクトルと
# ラプラシアンの逆行列の固有値ベクトルとは
# 符号の入れ替わりはあるが
# それ以外は同一であることを確認する
eout[[2]] - einvout[[2]][,n:1]
eout[[2]] + einvout[[2]][,n:1]

(eout[[2]] - einvout[[2]][,n:1]) * (eout[[2]] + einvout[[2]][,n:1])

2021-01-10

パラパラめくる『統計学を哲学する』

統計学哲学頻度主義ベイズ確率モデル統計モデル因果推論予測 AIC 深層学習認識論プラグマティズム認識論 GAN 検定事前分布事後分布尤度確率ぱらぱらめくるシリーズ

統計学を哲学する [ 大塚淳 ]

価格: 3520 円
楽天で詳細を見る

データを取って、手法を適用して、その結果を使う（検定する、推定する、予測する、論文に根拠として書く）とき、統計学・データサイエンスは、何をしてくれているのだろうか、と言うことを、いわゆる帰無仮説検定・ベイズ推定・モデル選択・過学習防止・深層学習/AI、因果推論に渡って、どれにも重きを置かずに(置かないように気を遣ってあることが強く感じられる書き方で)書かれた本でした
データを手法でいじるけど、結局、何を自分は言いたいの・・・と言うことに疑問を持っているときに読むと、色々な視点から、未解決問題やその例も含めて、理解が進むと思います
目次
- 序章　統計学を哲学する？（３本柱としての、存在論・意味論・認識論）
- 第１章　現代統計学のパラダイム
  - 記述統計(データと記述統計、経験主義、実証主義）
  - 推測統計(確率モデル、統計モデル）
- 第２章　ベイズ統計
  - ベイズ統計の意味論
  - ベイズ推論
  - ベイズ統計の哲学的側面(帰納論理、内在主義的認識論、認識論としてのベイズ）
- 第３章　古典統計
  - 頻度主義の意味論
  - 検定
  - 古典統計の哲学的側面(帰納行動、外在主義的認識論、認識論としての古典統計)
- 第４章　モデル選択と深層学習
  - 最尤法とモデル適合
  - モデル選択(AICとその哲学的含意）
  - 深層学習
  - 深層学習の哲学的含意(プラグマティズム認識論、徳認識論）
- 第５章　因果推論
  - 規則説と回帰分析
  - 反事実条件アプローチ
  - 構造的因果モデル
  - 統計的因果推論の哲学的含意
- 終章　統計学の存在論・意味論・認識論（統計学の扱う対象としては何が「存在」し、それは、現実世界・利用現場では何を「意味」し、データへの統計学・データサイエンス手法の適用から、何を知るのか、「認識」するのか
用語集
- 存在論・意味論・認識論
- 統計量、標本、多変量統計量
- 実証主義、理解できるような法則としてまとめる、思考の経済、記述統計、恒常的連結(因果の直接的発生源ではなく）
- 経験主義、実証主義、帰納、自然の斉一性
- 推測統計、確率モデル、確率論、母集団、標本空間、事象、確率・条件月確率、独立・従属、全確率・周辺化、ベイズ定理、確率変数・確率分布、同時確率分布、周辺確率分布、確率密度・確率密度関数、期待値・母平均・母分散、IID (independent and identically distributed)、大数の法則、中心極限定理、推定量、確率収束、統計モデル、パラメトリック統計・分布族、「確率種」
- ベイズ統計と主観・信念の度合い、尤度・事前確率・事後確率、仮説の確証と反証、パラメータ推定、予測、事後予測分布、機能論理、正当化された真なる信念、認識論的内在主義、真理促進的・遡行問題、基準率の誤謬、基礎付け主義、無差別の原理・無情報事前分布、経験ベイズ、主要原理、参照クラス、モデルチェック、仮説演繹法、デュエム・クワインテーゼ、認識論的全体論
- 頻度主義、蓋然的仮説の反証、反証主義、帰無仮説・対立仮説、帰無仮説、第１種過誤・第２種過誤、有意水準・サイズ・検出力・p値、検定と帰納行動、外在主義的認識論、信頼性主義、ゲティア問題、ノージックの追跡理論、信頼性主義的正当化、反事実的、可能世界意味論、p値問題、再現性の危機、多重検定、p-hacking、停止規則問題、一般性問題
- 最尤法、最尤推定量、対数尤度、モデル適合、学習、適合モデル、最小二乗法
- 回帰、説明変数、目的変数、モデル選択、過適合・過学習、赤池情報量基準、プラグマティズム、統計的一致性
- 深層学習、多層ニューラルネトワーク、誤差函数、誤差逆伝搬法、勾配消失問題、正則化
- プラグマティズム認識論、真理から予測へ
- 自然選択と試行錯誤による最適化、敵対的生成ネットワーク(GAN)、徳認識論（能力に基づいて得られる認識に対する尊重、の、ようなもの）、敵対的事例、動物的知識・反省的知識、説明可能な人工知能、表現学習・転移学習、翻訳の不確定性
- 統計的因果推論、規則説、交絡要因、条件付き独立、共変量、反事実条件説、仮説検定と因果推論、仮想結果、無作為化、因果推論の根本問題、潜在結果、平均処置効果、無作為化比較試験、強く無視できる割り当て条件、傾向スコア、反実仮想モデル、構造的因果モデル、因果グラフ、有向分離、因果的マルコフ条件、構造方程式、介入、バックドア基準、因果探索、忠実的条件、被覆法則モデル、三元論的な存在論、ベイズネット、因果種