古典確率空間と代数的確率空間

  • こちらで自由確率論・量子確率論というのを勉強するために少し書いた
  • こちらの文書を読んでいたのだが、「古典確率空間」と「代数的確率空間」との関係が理解できなくて全く前に進めなくなった。同文書の冒頭に『.代数的確率空間は, 古典確率論における確率空間を捨象し, 確率変数のなす (可換) 代数と平均値 E のもつ性質を抽象することで得られる概念である』とあるのだが、さっぱり解らなかったが、この表現の中にある『捨象し』が重要であるらしかった。『捨象し』っていうのは、「同じ確率空間という単語を使っているけど、表している対象に対応がとれるようなタイプの拡張ではなくて、大きなくくりでは共通するが、違いが大きいものとして捉えなおせ」ということを言っているようだ
  • 以下、その線に沿っての(現時点での)理解を書く
  • 古典確率空間っていうのは、確率変数を定義することができる「場所」のようなもの
    • 「なにが起きた、かにが起きた」というときの「なに」「かに」を全部集めた\Omegaがあって、
  • \Omegaには、どことどこはどんな風につながっているのか、つながっているからにはそれを\Omegaの部分集合として定められるよ、というような位相構造がある。\Omegaが有限離散要素の集合のときには、それぞれの要素に「有限の広さ」があるが、\Omegaが連続空間のときには、各点の「広さ」は無限小である。\Omegaの部分集合として初めて「広さ」が定まるようになる。これが\sigma加法族な構造
  • さらに、\Omegaの部分集合について[0,1]なる実数が対応づいている
  • この構成が古典確率空間
  • この古典確率空間には、\Omegaの部分集合にどのくらいの実数値を対応付けるかという写像を定めることができて、確率変数とは、この写像として定義できる
  • 大雑把に言うと、「古典確率空間」は古典的な確率変数を関数として定義する条件をそろえた環境のようなもの
  • さて。代数的確率空間の方は?というと
  • まず、古典確率空間・古典的確率変数と代数的確率空間との関係がどうなるかを見てみたい
  • 代数的確率空間では、*-代数がある。これには構成要素とそれらが満足する演算規則があるわけだが、この*-代数の要素は、古典的確率変数が対応し、*-代数は、古典的確率変数の(ある種の)集合が対応する
  • したがって、古典確率空間では、古典的確率変数を写像として表す場が「空間」であったが、代数的確率空間では、古典的確率変数が*-代数の集合に対応している点が違う。前者は、古典的確率変数が「空間に広がっている」のに対し、後者は、古典的確率変数が「空間の要素(点)」になっている
  • 代数的確率空間では状態と呼ばれる「空間」を複素数に対応付ける写像があるが、古典的確率変数をその期待値に対応付ける写像は、この「代数的確率空間の状態」であることが知られている
  • また、これからわかるように、代数的確率変数は、代数的確率空間の*-代数の要素のことである

Sum-of-Chi-squares

  • Sum-of-Chi-square統計量と言うのがあって、それを遺伝子ごとの関連シグナル検出に使う、という話がある(こちら

journals.plos.org
)

  • ちょっと主旨は変わるが、1SNPの2x3テーブルに対して、優性・劣性・相加の3検定を実施してそのカイ二乗統計量の和を検定等計量としてみるとどのような統計量等高線が描けるかをやってみる


f:id:ryamada22:20190108120957j:plain

自由確率論・量子確率論

  • いわゆる確率論と違う確率論として「自由確率論」とか「量子確率論」と呼ばれるものがあるらしい
  • いわゆる確率論が確率変数が取る値が集合の要素であって、集合の要素に非負な確率密度(確率質量)があって、それを全部積分して1になる、というものなのに対して
  • 自由確率論・量子確率論では、確率変数が可換とは限らない要素に対応して、その要素を複素数に対応付ける関数が定義されているものになっている
  • 「1」に大事な意味があること、「非負」に大事な意味があることはいわゆる確率論と同じであるが、なにが「1」でなにが「非負」かというところが拡張されている
  • どうしてそんなものが「確率論」なのかというと、量子力学とかでは、対象(質量とか運動量とか)が作用素になっていて、それらに「確率」を考えることになっているわけだが、その質量とか運動量とか(それらは非可換)の確率論をしたかったのが動機らしい
  • 動機は量子力学だが、応用範囲は広いらしい
  • ひとまずの資料はこちら
  • 自由確率論・量子確率論では、代数的確率空間((A,\psi)というペア)を考える
  • Aは*-代数(「スター代数」)と呼ばれるもので、\psiは状態と呼ばれる写像A \to \mathbf{C})である
  • *-代数Aは、複素数体\mathbf{C}上の代数である。言い換えると、要素に和と積が定義されていて、複素数倍もうまく回り、積は非可換でもよいようなもの。多元環。さらに条件がついて、複素正方行列の共役転置が満足するようなルール(それを対合 involution と言う)を持つ。それが*-代数
  • 何のことかわからないので、例で考える
  • 2つの例を考える。複素正方行列全体と、(1x1実行列としての)実数全体との2つで確認することにする
  • また、この状態(という写像)には正方行列が1対1対応しており、その正方行列は正定値でトレースが1であるという性質を持つ。これを「密度行列」と言う。状態が「確率密度」になっている、というのが、量子力学的(状態は確率密度分布)な状態表現であることに対応している


  • n項のいずれかを取るような確率質量分布は(p_1,...,p_n);\sum p_i=1,p_i \ge 0となる(いわゆる普通のn状態の分布)。とりうるすべての状態はn-1単体に相当するが、それを「状態」と考えるとき、その状態関数(写像)を\psi (a) = \sum p_i a_iとし、それに対応するn次元複素ベクトルaが*-代数になっていてくれると、代数的確率空間で話ができるようになる。そのような*-代数として、n次元複素ベクトルについて、ベクトル和と、「積」として、要素ワイズの積をとり、対合として、要素ワイズの共役複素数を取らせることで作ることができる。ほら、普通の正単体が表す確率分布空間が代数的確率空間として記述てきた〜 というのはひとつの例

パラパラめくる『Nature Reviews Genetics』2018

医療経済分析

  • Rに個人の時系列変化を追いかけて治療法(治療薬)の経済性を解析するパッケージ hesim がある。そのVignette(こちら)のコードをなぞってみる。オリジナルサイトのコードだとエラーが出るので、ちょっと修正してある