2019-01-22

2x3 表のパワー計算の視覚化

SNP パワー

2019-01-16

古典確率空間と代数的確率空間

自由確率論量子確率論 *-代数非可換環論測度論確率空間確率変数

こちらで自由確率論・量子確率論というのを勉強するために少し書いた
こちらの文書を読んでいたのだが、「古典確率空間」と「代数的確率空間」との関係が理解できなくて全く前に進めなくなった。同文書の冒頭に『.代数的確率空間は, 古典確率論における確率空間を捨象し, 確率変数のなす (可換) 代数と平均値 E のもつ性質を抽象することで得られる概念である』とあるのだが、さっぱり解らなかったが、この表現の中にある『捨象し』が重要であるらしかった。『捨象し』っていうのは、「同じ確率空間という単語を使っているけど、表している対象に対応がとれるようなタイプの拡張ではなくて、大きなくくりでは共通するが、違いが大きいものとして捉えなおせ」ということを言っているようだ
以下、その線に沿っての(現時点での)理解を書く
古典確率空間っていうのは、確率変数を定義することができる「場所」のようなもの
- 「なにが起きた、かにが起きた」というときの「なに」「かに」を全部集めた $\Omega$ があって、
$\Omega$ には、どことどこはどんな風につながっているのか、つながっているからにはそれを $\Omega$ の部分集合として定められるよ、というような位相構造がある。 $\Omega$ が有限離散要素の集合のときには、それぞれの要素に「有限の広さ」があるが、 $\Omega$ が連続空間のときには、各点の「広さ」は無限小である。 $\Omega$ の部分集合として初めて「広さ」が定まるようになる。これが $\sigma$ 加法族な構造
さらに、 $\Omega$ の部分集合について $[0,1]$ なる実数が対応づいている
この構成が古典確率空間
この古典確率空間には、 $\Omega$ の部分集合にどのくらいの実数値を対応付けるかという写像を定めることができて、確率変数とは、この写像として定義できる
大雑把に言うと、「古典確率空間」は古典的な確率変数を関数として定義する条件をそろえた環境のようなもの
さて。代数的確率空間の方は？というと
まず、古典確率空間・古典的確率変数と代数的確率空間との関係がどうなるかを見てみたい
代数的確率空間では、*-代数がある。これには構成要素とそれらが満足する演算規則があるわけだが、この*-代数の要素は、古典的確率変数が対応し、*-代数は、古典的確率変数の(ある種の)集合が対応する
したがって、古典確率空間では、古典的確率変数を写像として表す場が「空間」であったが、代数的確率空間では、古典的確率変数が*-代数の集合に対応している点が違う。前者は、古典的確率変数が「空間に広がっている」のに対し、後者は、古典的確率変数が「空間の要素(点)」になっている
代数的確率空間では状態と呼ばれる「空間」を複素数に対応付ける写像があるが、古典的確率変数をその期待値に対応付ける写像は、この「代数的確率空間の状態」であることが知られている
また、これからわかるように、代数的確率変数は、代数的確率空間の*-代数の要素のことである
そしてこのモーメント列を比較すれば、古典確率変数としての異同もわかる、という意味で、モーメント列は古典確率変数の本質を担っている
さて。代数的確率変数の場合にも、このモーメントが存在し、大事な役割をするが、ちょっと複雑になる
- その理由の１つ目は、古典確率変数で $a^2$ というのを考えるとき、 $a \times a$ を考えているわけだが、これを、代数的確率変数に拡張しようとしたとき、 $a \times a^*$ と $a \times a$ との２つに区別することができるためである。なぜなら、古典確率変数では $a = a^*$ であるから $a \times a = a \times a^*$ であるからである
- その理由の2つ目は、掛け算の順序の問題である。古典確率変数では、 $a \times b = b \times a$ であるから、 $a^k$ を考えるとき、 $k$ の値だけが問題となる。他方、代数的確率変数では、 $a \times a^* \ne a^* \times a$ であるので、 $a$ もしくは $a^*$ をいくつ掛け合わせたかを考えるときに、 $a$ の個数と $a^*$ の個数のみを区別すれば事足りるわけではなく、 $a$ と $a^*$ とが作る順列の数の場合わけが必要だからである
- このように、モーメントとして扱う量が多くなる(それを混合モーメントと呼ぶ)が、混合モーメントは代数的確率変数は重要で、混合モーメントがすべて等しい２つの代数的確率変数は、「同じ～確率同値」と言う

2019-01-08

Triangle plot of HWE

2019-01-08

Sum-of-Chi-squares

SNP 遺伝関連検定

Sum-of-Chi-square統計量と言うのがあって、それを遺伝子ごとの関連シグナル検出に使う、という話がある(こちら

journals.plos.org
)

ちょっと主旨は変わるが、１ＳＮＰの２ｘ３テーブルに対して、優性・劣性・相加の３検定を実施してそのカイ二乗統計量の和を検定等計量としてみるとどのような統計量等高線が描けるかをやってみる

f:id:ryamada22:20190108120957j:plain

2019-01-06

自由確率論・量子確率論・確率変数の量子分解

自由確率論量子確率論 *-代数非可換環論スペクトル

いわゆる確率論と違う確率論として「自由確率論」とか「量子確率論」と呼ばれるものがあるらしい
いわゆる確率論が確率変数が取る値が集合の要素であって、集合の要素に非負な確率密度（確率質量）があって、それを全部積分して１になる、というものなのに対して
自由確率論・量子確率論では、確率変数が可換とは限らない要素に対応して、その要素を複素数に対応付ける関数が定義されているものになっている
「１」に大事な意味があること、「非負」に大事な意味があることはいわゆる確率論と同じであるが、なにが「１」でなにが「非負」かというところが拡張されている
どうしてそんなものが「確率論」なのかというと、量子力学とかでは、対象（質量とか運動量とか）が作用素になっていて、それらに「確率」を考えることになっているわけだが、その質量とか運動量とか（それらは非可換）の確率論をしたかったのが動機らしい
動機は量子力学だが、応用範囲は広いらしい
ひとまずの資料はこちら
自由確率論・量子確率論では、代数的確率空間（ $(A,\psi)$ というペア）を考える
$A$ は*-代数（「スター代数」）と呼ばれるもので、 $\psi$ は状態と呼ばれる写像/作用素（ $A \to \mathbf{C}$ )である
*-代数 $A$ は、複素数体 $\mathbf{C}$ 上の代数である。言い換えると、要素に和と積が定義されていて、複素数倍もうまく回り、積は非可換でもよいようなもの。多元環。さらに条件がついて、複素正方行列の共役転置が満足するようなルール（それを対合 involution と言う)を持つ。それが*-代数
何のことかわからないので、例で考える
２つの例を考える。複素正方行列全体と、（1x1実行列としての）実数全体との２つで確認することにする
また、この状態（という写像/作用素）には正方行列が１対１対応しており、その正方行列は正定値でトレースが１であるという性質を持つ。これを「密度行列」と言う。状態が「確率密度」になっている、というのが、量子力学的（状態は確率密度分布）な状態表現であることに対応している

n項のいずれかを取るような確率質量分布はとなる（いわゆる普通のn状態の分布）。とりうるすべての状態はn-1単体に相当するが、それを「状態」と考えるとき、その状態関数（写像/作用素）をとし、それに対応するn次元複素ベクトルaが*-代数になっていてくれると、代数的確率空間で話ができるようになる。そのような*-代数として、n次元複素ベクトルについて、ベクトル和と、「積」として、要素ワイズの積をとり、対合として、要素ワイズの共役複素数を取らせることで作ることができる。ほら、普通の正単体が表す確率分布空間が代数的確率空間として記述てきた〜　というのはひとつの例
- $\sum a_i b_i$ は内積の形をしているが、ベクトル空間の点に対して、線形汎関数を作用させて(内積の値と言う)値を返す、と見れば、線形汎関数/双対空間の枠組みの話となり、線型汎関数を作用素の一形(スカラーを返す場合、X → YのYが１次元の場合)とみなせば、作用素とも見える
古典確率空間・古典確率変数と、代数的確率空間・代数的確率変数との対応については、こちら

ryamada22.hatenablog.jp
に書き出しておいた

その先に進もう
いわゆる古典確率変数は実確率変数であり、対合に関して $a=a^*$ が成り立つものである。このような古典確率変数の関数としての素性はモーメント( $\int x^p p(x) dx$ )で表すことができる(ものが多い)
代数的確率変数の場合もモーメントは大事だが、 $a \ne = a^*$ であるため、モーメントには $a,a^*$ の内訳数とその並び順のバリエーションが存在する。バリエーションは大きいが相変わらずモーメント列は重要で、代数的確率変数の同値性と関係する。スペクトル分布とも呼ばれる。
具体例がないとなんのことだかさっぱりわからない
- ベルヌーイ分布を考える。1または-1がそれぞれ、確率0.5で現れるような確率変数のことである
- これの代数的確率変数的表現として以下のようなものがある
- *-代数として、 $2\times 2$ 複素行列をとる。いわゆる行列の積、共役転置を対合とする
- ここに、状態として、行列のトレースをとる( $\psi_{tr}(a)$ )
- このとき、 $\begin{pmatrix} 0 1 \\1 0 \end{pmatrix}$ という、*-代数の１要素である行列が、ベルヌーイ分布を表している
- 表している、というのは、 $\psi_{tr}(a^m)$ で表されるスペクトルが、ベルヌーイ分布からの試行回数mの時の期待値になっている、という意味である
- この行列をベルヌーイ分布を与える実確率変数の代数的実現と言う
- ちなみに代数的実現は一意的ではない
2 量子分解
- モーメント列が確率変数を表すことは前項の通り
- 多項式列も同様に確率変数を表すことがある
  - ただし、多項式列と確率変数とは１対１対応ではない
  - 多項式列には、直交多項式の列、チェビシェフ多項式の列、３項間漸化式とヤコビ係数、自由マイクスナー分布などがある
- これらを駆使すると、 $X = B^+ + B^- + B^\circ$ と言う分解が得られる
- これは確立変数Xと $B^+ + B^- + B^\circ$ とが、確率同値であると言っている
- なお、 $B^+$ を生成作用素、 $B^-$ を消滅作用素、 $B^\circ$ を保存作用素と呼ぶ
- これを量子分解と言う