古典確率空間と代数的確率空間
- こちらで自由確率論・量子確率論というのを勉強するために少し書いた
- こちらの文書を読んでいたのだが、「古典確率空間」と「代数的確率空間」との関係が理解できなくて全く前に進めなくなった。同文書の冒頭に『.代数的確率空間は, 古典確率論における確率空間を捨象し, 確率変数のなす (可換) 代数と平均値 E のもつ性質を抽象することで得られる概念である』とあるのだが、さっぱり解らなかったが、この表現の中にある『捨象し』が重要であるらしかった。『捨象し』っていうのは、「同じ確率空間という単語を使っているけど、表している対象に対応がとれるようなタイプの拡張ではなくて、大きなくくりでは共通するが、違いが大きいものとして捉えなおせ」ということを言っているようだ
- 以下、その線に沿っての(現時点での)理解を書く
- 古典確率空間っていうのは、確率変数を定義することができる「場所」のようなもの
- 「なにが起きた、かにが起きた」というときの「なに」「かに」を全部集めたがあって、
- には、どことどこはどんな風につながっているのか、つながっているからにはそれをの部分集合として定められるよ、というような位相構造がある。が有限離散要素の集合のときには、それぞれの要素に「有限の広さ」があるが、が連続空間のときには、各点の「広さ」は無限小である。の部分集合として初めて「広さ」が定まるようになる。これが加法族な構造
- さらに、の部分集合についてなる実数が対応づいている
- この構成が古典確率空間
- この古典確率空間には、の部分集合にどのくらいの実数値を対応付けるかという写像を定めることができて、確率変数とは、この写像として定義できる
- 大雑把に言うと、「古典確率空間」は古典的な確率変数を関数として定義する条件をそろえた環境のようなもの
- さて。代数的確率空間の方は?というと
- まず、古典確率空間・古典的確率変数と代数的確率空間との関係がどうなるかを見てみたい
- 代数的確率空間では、*-代数がある。これには構成要素とそれらが満足する演算規則があるわけだが、この*-代数の要素は、古典的確率変数が対応し、*-代数は、古典的確率変数の(ある種の)集合が対応する
- したがって、古典確率空間では、古典的確率変数を写像として表す場が「空間」であったが、代数的確率空間では、古典的確率変数が*-代数の集合に対応している点が違う。前者は、古典的確率変数が「空間に広がっている」のに対し、後者は、古典的確率変数が「空間の要素(点)」になっている
- 代数的確率空間では状態と呼ばれる「空間」を複素数に対応付ける写像があるが、古典的確率変数をその期待値に対応付ける写像は、この「代数的確率空間の状態」であることが知られている
- また、これからわかるように、代数的確率変数は、代数的確率空間の*-代数の要素のことである
- そしてこのモーメント列を比較すれば、古典確率変数としての異同もわかる、という意味で、モーメント列は古典確率変数の本質を担っている
- さて。代数的確率変数の場合にも、このモーメントが存在し、大事な役割をするが、ちょっと複雑になる
- その理由の1つ目は、古典確率変数でというのを考えるとき、を考えているわけだが、これを、代数的確率変数に拡張しようとしたとき、ととの2つに区別することができるためである。なぜなら、古典確率変数ではであるからであるからである
- その理由の2つ目は、掛け算の順序の問題である。古典確率変数では、であるから、を考えるとき、の値だけが問題となる。他方、代数的確率変数では、であるので、もしくはをいくつ掛け合わせたかを考えるときに、の個数との個数のみを区別すれば事足りるわけではなく、ととが作る順列の数の場合わけが必要だからである
- このように、モーメントとして扱う量が多くなる(それを混合モーメントと呼ぶ)が、混合モーメントは代数的確率変数は重要で、混合モーメントがすべて等しい2つの代数的確率変数は、「同じ~確率同値」と言う
Sum-of-Chi-squares
- Sum-of-Chi-square統計量と言うのがあって、それを遺伝子ごとの関連シグナル検出に使う、という話がある(こちら
- ちょっと主旨は変わるが、1SNPの2x3テーブルに対して、優性・劣性・相加の3検定を実施してそのカイ二乗統計量の和を検定等計量としてみるとどのような統計量等高線が描けるかをやってみる
自由確率論・量子確率論・確率変数の量子分解
- いわゆる確率論と違う確率論として「自由確率論」とか「量子確率論」と呼ばれるものがあるらしい
- いわゆる確率論が確率変数が取る値が集合の要素であって、集合の要素に非負な確率密度(確率質量)があって、それを全部積分して1になる、というものなのに対して
- 自由確率論・量子確率論では、確率変数が可換とは限らない要素に対応して、その要素を複素数に対応付ける関数が定義されているものになっている
- 「1」に大事な意味があること、「非負」に大事な意味があることはいわゆる確率論と同じであるが、なにが「1」でなにが「非負」かというところが拡張されている
- どうしてそんなものが「確率論」なのかというと、量子力学とかでは、対象(質量とか運動量とか)が作用素になっていて、それらに「確率」を考えることになっているわけだが、その質量とか運動量とか(それらは非可換)の確率論をしたかったのが動機らしい
- 動機は量子力学だが、応用範囲は広いらしい
- ひとまずの資料はこちら
- 自由確率論・量子確率論では、代数的確率空間(というペア)を考える
- は*-代数(「スター代数」)と呼ばれるもので、は状態と呼ばれる写像/作用素()である
- *-代数は、複素数体上の代数である。言い換えると、要素に和と積が定義されていて、複素数倍もうまく回り、積は非可換でもよいようなもの。多元環。さらに条件がついて、複素正方行列の共役転置が満足するようなルール(それを対合 involution と言う)を持つ。それが*-代数
- 何のことかわからないので、例で考える
- 2つの例を考える。複素正方行列全体と、(1x1実行列としての)実数全体との2つで確認することにする
- また、この状態(という写像/作用素)には正方行列が1対1対応しており、その正方行列は正定値でトレースが1であるという性質を持つ。これを「密度行列」と言う。状態が「確率密度」になっている、というのが、量子力学的(状態は確率密度分布)な状態表現であることに対応している
- n項のいずれかを取るような確率質量分布はとなる(いわゆる普通のn状態の分布)。とりうるすべての状態はn-1単体に相当するが、それを「状態」と考えるとき、その状態関数(写像/作用素)をとし、それに対応するn次元複素ベクトルaが*-代数になっていてくれると、代数的確率空間で話ができるようになる。そのような*-代数として、n次元複素ベクトルについて、ベクトル和と、「積」として、要素ワイズの積をとり、対合として、要素ワイズの共役複素数を取らせることで作ることができる。ほら、普通の正単体が表す確率分布空間が代数的確率空間として記述てきた〜 というのはひとつの例
- 古典確率空間・古典確率変数と、代数的確率空間・代数的確率変数との対応については、こちら
ryamada22.hatenablog.jp
に書き出しておいた
- その先に進もう
- いわゆる古典確率変数は実確率変数であり、対合に関してが成り立つものである。このような古典確率変数の関数としての素性はモーメント()で表すことができる(ものが多い)
- 代数的確率変数の場合もモーメントは大事だが、であるため、モーメントにはの内訳数とその並び順のバリエーションが存在する。バリエーションは大きいが相変わらずモーメント列は重要で、代数的確率変数の同値性と関係する。スペクトル分布とも呼ばれる。
- 具体例がないとなんのことだかさっぱりわからない
- ベルヌーイ分布を考える。1または-1がそれぞれ、確率0.5で現れるような確率変数のことである
- これの代数的確率変数的表現として以下のようなものがある
- *-代数として、複素行列をとる。いわゆる行列の積、共役転置を対合とする
- ここに、状態として、行列のトレースをとる()
- このとき、という、*-代数の1要素である行列が、ベルヌーイ分布を表している
- 表している、というのは、で表されるスペクトルが、ベルヌーイ分布からの試行回数mの時の期待値になっている、という意味である
- この行列をベルヌーイ分布を与える実確率変数の代数的実現と言う
- ちなみに代数的実現は一意的ではない
- 2 量子分解
パラパラめくる『Nature Reviews Genetics』2018
- 12月号
- 11月号
- RNA velocity method ("RNA velocity that leverages nascent unspliced RNA to deduce the future transcriptional states of cells", "RNA velocity—the time derivative of the gene expression state—can be directly estimated by distinguishing between unspliced and spliced mRNAs in common single-cell RNA sequencing protocols"(Naturevolume 560, pages494–498 (2018) ))
- 10月号
- 9月号
- AML発病の『前がん状態』
- IDR("Many eukaryotic proteins contain intrinsically disordered regions (IDRs), which serve as flexible platforms for protein–protein interactions and can phase-separate into liquid-like condensates. "]
- メンデリアン・ランダマイゼーション他(因果関係を推定するために遺伝的多様性を使う)
- polygenic risk scoresの有用性の現在
- 8月号
- 7月号
- 6 月号
- 5月号
- 4月号
- 3月号
- 2月号
- 1月号
- Alternate promoter selection
- R loop("R loops — hybrid nucleic acid structures in which RNA is hybridized to one strand of DNA while the other strand of DNA is displaced and 'loops out'. Chen et al. describe a chromatin ")
- Essentiality of genes