Sum-of-Chi-squares
- Sum-of-Chi-square統計量と言うのがあって、それを遺伝子ごとの関連シグナル検出に使う、という話がある(こちら
- ちょっと主旨は変わるが、1SNPの2x3テーブルに対して、優性・劣性・相加の3検定を実施してそのカイ二乗統計量の和を検定等計量としてみるとどのような統計量等高線が描けるかをやってみる
自由確率論・量子確率論・確率変数の量子分解
- いわゆる確率論と違う確率論として「自由確率論」とか「量子確率論」と呼ばれるものがあるらしい
- いわゆる確率論が確率変数が取る値が集合の要素であって、集合の要素に非負な確率密度(確率質量)があって、それを全部積分して1になる、というものなのに対して
- 自由確率論・量子確率論では、確率変数が可換とは限らない要素に対応して、その要素を複素数に対応付ける関数が定義されているものになっている
- 「1」に大事な意味があること、「非負」に大事な意味があることはいわゆる確率論と同じであるが、なにが「1」でなにが「非負」かというところが拡張されている
- どうしてそんなものが「確率論」なのかというと、量子力学とかでは、対象(質量とか運動量とか)が作用素になっていて、それらに「確率」を考えることになっているわけだが、その質量とか運動量とか(それらは非可換)の確率論をしたかったのが動機らしい
- 動機は量子力学だが、応用範囲は広いらしい
- ひとまずの資料はこちら
- 自由確率論・量子確率論では、代数的確率空間(というペア)を考える
- は*-代数(「スター代数」)と呼ばれるもので、は状態と呼ばれる写像/作用素()である
- *-代数は、複素数体上の代数である。言い換えると、要素に和と積が定義されていて、複素数倍もうまく回り、積は非可換でもよいようなもの。多元環。さらに条件がついて、複素正方行列の共役転置が満足するようなルール(それを対合 involution と言う)を持つ。それが*-代数
- 何のことかわからないので、例で考える
- 2つの例を考える。複素正方行列全体と、(1x1実行列としての)実数全体との2つで確認することにする
- また、この状態(という写像/作用素)には正方行列が1対1対応しており、その正方行列は正定値でトレースが1であるという性質を持つ。これを「密度行列」と言う。状態が「確率密度」になっている、というのが、量子力学的(状態は確率密度分布)な状態表現であることに対応している
- n項のいずれかを取るような確率質量分布はとなる(いわゆる普通のn状態の分布)。とりうるすべての状態はn-1単体に相当するが、それを「状態」と考えるとき、その状態関数(写像/作用素)をとし、それに対応するn次元複素ベクトルaが*-代数になっていてくれると、代数的確率空間で話ができるようになる。そのような*-代数として、n次元複素ベクトルについて、ベクトル和と、「積」として、要素ワイズの積をとり、対合として、要素ワイズの共役複素数を取らせることで作ることができる。ほら、普通の正単体が表す確率分布空間が代数的確率空間として記述てきた〜 というのはひとつの例
- 古典確率空間・古典確率変数と、代数的確率空間・代数的確率変数との対応については、こちら
ryamada22.hatenablog.jp
に書き出しておいた
- その先に進もう
- いわゆる古典確率変数は実確率変数であり、対合に関してが成り立つものである。このような古典確率変数の関数としての素性はモーメント()で表すことができる(ものが多い)
- 代数的確率変数の場合もモーメントは大事だが、であるため、モーメントにはの内訳数とその並び順のバリエーションが存在する。バリエーションは大きいが相変わらずモーメント列は重要で、代数的確率変数の同値性と関係する。スペクトル分布とも呼ばれる。
- 具体例がないとなんのことだかさっぱりわからない
- ベルヌーイ分布を考える。1または-1がそれぞれ、確率0.5で現れるような確率変数のことである
- これの代数的確率変数的表現として以下のようなものがある
- *-代数として、複素行列をとる。いわゆる行列の積、共役転置を対合とする
- ここに、状態として、行列のトレースをとる()
- このとき、という、*-代数の1要素である行列が、ベルヌーイ分布を表している
- 表している、というのは、で表されるスペクトルが、ベルヌーイ分布からの試行回数mの時の期待値になっている、という意味である
- この行列をベルヌーイ分布を与える実確率変数の代数的実現と言う
- ちなみに代数的実現は一意的ではない
- 2 量子分解
パラパラめくる『Nature Reviews Genetics』2018
- 12月号
- 11月号
- RNA velocity method ("RNA velocity that leverages nascent unspliced RNA to deduce the future transcriptional states of cells", "RNA velocity—the time derivative of the gene expression state—can be directly estimated by distinguishing between unspliced and spliced mRNAs in common single-cell RNA sequencing protocols"(Naturevolume 560, pages494–498 (2018) ))
- 10月号
- 9月号
- AML発病の『前がん状態』
- IDR("Many eukaryotic proteins contain intrinsically disordered regions (IDRs), which serve as flexible platforms for protein–protein interactions and can phase-separate into liquid-like condensates. "]
- メンデリアン・ランダマイゼーション他(因果関係を推定するために遺伝的多様性を使う)
- polygenic risk scoresの有用性の現在
- 8月号
- 7月号
- 6 月号
- 5月号
- 4月号
- 3月号
- 2月号
- 1月号
- Alternate promoter selection
- R loop("R loops — hybrid nucleic acid structures in which RNA is hybridized to one strand of DNA while the other strand of DNA is displaced and 'loops out'. Chen et al. describe a chromatin ")
- Essentiality of genes