代数統計

メモ

背景 はっきりとしたことがいえるほどの情報がない状況。そもそも集まらなそうな状況 例を挙げよう 希少な状況・相対的に希少な状況 時間変化がある状況 情報がそのまま当てはまらない状況 情報化:情報は集まる。判断に関してプアな状況 「決断理論」の学際…

分割表を代数統計する

2x2表をSingular でやってみよう x+y=p1,z+w=p2,x+z=q1,y+w=q2とする(p1,p2,q1,q2が周辺度数) ring p = 0,(p1,p2,q1,q2),lp; ring x = 0,(x,y,z,w),lp; setring p; map f = x,p1*q1,p1*q2,p2*q1,p2*q2; ideal i0 = 0; setring x; preimage(p,f,i0); これは前…

連鎖平衡を代数統計する

2アレル多型が2つある。そのアレル頻度をそれぞれp1,p2,q1,q2とする 連鎖平衡の下での4ハプロタイプの頻度をh1,h2,h3,h4とする Singularを使ってやってみる ring p=0,(p1,p2,q1,q2),lp; ring h=0,(h1,h2,h3,h4),lp; setring p; map f = h,p1*q1,p1*q2,p2*q…

Hardy-Weinberg Equilibriumを代数統計する

こちらから 2アレル多型の2つのアレルの頻度をそれぞれp1,p2とする HWEの下での3ディプロタイプの頻度をg1,g2,g3とする の関係にある g1,g2,g3には制約関数があるが、それを代数アプリケーションSingularで求めてみる ring p = 0,(p1,p2),lp; ring g = 0,(g…

Macaulay2をインストールする

こちらで代数統計をやっている論文を読んでいる マルコフ基底の計算はSingularでやっている(そのインストールなどはこちら) Triangulationの計算はMacaulay2でやっているので、それもインストールしてみる その前にそもそもTriangulationとは 日本語言えば「…

論文メモ

こちらで扱う論文の"Take-home-message"を作るためのメモ 論文 理論説明論文 この論文で学ぶこと 代数統計について その何者か その統計解析における位置づけ こちらを参照 Fitness landscape こちらに掲載 Epistasis 変異組合せと行列・アレイ Genotope:Gen…

分割表とトーリックイデアル

こちらでもリンクしたこちらの話しの自分なりのリ・フレーズ イデアルについてはこちらを k次元分割表があって、第i軸のカテゴリ数がで、表全体として個のセルがある log-linear modelでの各セルの頻度は,ただしは第i軸の第カテゴリの頻度で表される ある観…

メモ

代数統計でトーリックモデル log-linear modelらしい トーリックをお話し風に:こちら トーリックと分割表:こちら トーリック多様体:関連リンクいろいろ

Singularで環 代数統計ソフトウェア

ソフトウェアのインストールが済んで、簡単なことができるようになったので、環を扱ってみよう > ring myring = 32003,(x,y,z),(dp,C); のように"myring"という名前の環を定義する 以下が定義の3要素 coefficients, names_of_ring_variables,ordering ring …

Singular 代数統計ソフトウェア

代数統計はデータの構造(グラフや群環体)に注目してデータを把握しようとします 便利なソフトウェアもあります 多項式、可換環論、計算機代数幾何。代数統計にとても便利だ、というSingularを使ってみる Singularのサイト ダウンロードはこちらのcygwinバー…

代数統計ソフトウェア

代数統計はデータの構造(グラフや群環体)に注目してデータを把握しようとします 便利なソフトウェアもあります 『Algebraic statistics for computational biology』:Part I(基礎)2計算機科学より 目次はこちら 2.5 ソフトウェア 数学ソフト "4TI2" 非負整…

Part I(基礎)4生物学 ぱらぱらめくる『Algebraic statistics for computational biology』

目次はこちら 4.1 ゲノム 4.2 データ 4.3 問題 4.4 生物学の配列の統計モデル 4.5 変異の統計モデル

Part I(基礎)3代数学 ぱらぱらめくる『Algebraic statistics for computational biology』

目次はこちら 代数統計学では『統計モデルは代数多様体』とする 代数多様体(algebraic varieties)とはこちらにあるように "多変数の連立多項式系の解集合として定義される図形" 例:Hardy-Weinberg Equilibriumが作る3角形内の曲線 表現方法2つ (連立)方程…

Part I(基礎)2計算機科学 ぱらぱらめくる『Algebraic statistics for computational biology』

目次はこちら 離散アルゴリズムは数値アルゴリズムと並び立つもの。数値アルゴリズムは前章のEMもそうだし、固有値分解もそう。離散データには離散アルゴリズム 2.1 Tropical arithmetic と動的計画法 動的計画法はだんだんに必要なものを積み上げて解に到達…

Part I(基礎)1統計学 ぱらぱらめくる『Algebraic statistics for computational biology』

Algebraic Statistics for Computational Biology作者: L. Pachter,B. Sturmfels出版社/メーカー: Cambridge University Press発売日: 2005/08/22メディア: ハードカバー購入: 1人 クリック: 9回この商品を含むブログを見る 目次はこちら いわゆる統計学の考…

目次 ぱらぱらめくる『Algebraic statistics for computational biology』

Algebraic Statistics for Computational Biology作者: L. Pachter,B. Sturmfels出版社/メーカー: Cambridge University Press発売日: 2005/08/22メディア: ハードカバー購入: 1人 クリック: 9回この商品を含むブログを見る 4塩基ATGCが作る四面体、塩基配列…

プレゼンテーションに挑戦

明日から神戸でIBC2012が始まります。(こちら) 仲間内からは、多次元分割表の代数統計的取扱いとDNA鑑定に線形代数とその統計量の近似計算法とがテーマとして発表される予定です 特にチャレンジングなのは弱冠二十歳でのオーラルプレゼンテーション(多次元分…

周辺度数の制約によって期待値を計算する

log-linear modelにおける期待値は次のように考える k次元表の各セルは、そのセルが、第1,2,...,k番目の尺度において、それぞれ番目のカテゴリであるというように指定することができる これをと表すことにする 他方、周辺度数制約の複体表現において、あるFa…

周辺度数の制約を複体を使って表す

「周辺度数」は尺度の組合せごとにあるから、「あるパターンで周辺度数が制約されている」というのは、「制約されている尺度の組合せの集合」として定義される 今、ある尺度の組合せが制約されているとすると、その組合せの部分集合の尺度の組合せも(もれな…

周辺度数を計算する

周辺度数は「特定の軸」についての足し算である Rでは、arrayという形式のオブジェクトにapply()関数を使って、特定の軸の組に足し算(sum())を作用させることで得られる k<-3 r<-sample(2:3,k,replace=TRUE) print(r) R<-prod(r) print(R) A<-array(1:R,r) p…

多次元表を作る

表の次元をとする 第i(i=1,2,...,k)尺度のカテゴリ数をとし、とする は表のセル数である 適当にk次元の表Aを作ってみよう k<-3 r<-sample(2:4,k,replace=TRUE) print(r) R<-prod(r) print(R) A<-array(1:R,r) print(A) > k<-3 > r<-sample(2:4,k,replace=TRU…

log-linear model 分割表を扱う

以下の日本語の本で言うところの、第4章 マルコフ基底と実験計画法(こちらも参照)、英語の本で言うところの、第1章 Markov Basis(こちらも参照) で扱われている多次元分割表の期待値算出をする グレブナー道場作者: JST CREST 日比チーム出版社/メーカー: …

分割表の位置・自由度・座標変換のまとめ 分割表の正単体・複体座標表現によるカイ二乗検定

こちらの整理記事 次元の表がある th()次元のカテゴリ数をとする のセルの総数はである には、複体で表される周辺度数制約がある ここでは(正)単体であり、の頂点はの部分集合である による周辺度数制約とは、が作る、の部分表に相当する周辺度数が与えられ…

メモ

Algebraic Statistics 2012 @ Penn State Univ.(こちら)

分割表の位置・自由度・座標変換4 分割表の正単体・複体座標表現

多次元分割表の尺度別カテゴリ数がであるときの、表のセルの総数はである このような表にの行列を次のように与える 個の尺度の集合のべき集合の個の要素ごとに、それらが作る複合カテゴリ個に対応させた、長さのベクトルが算出されている 元の次元分割表の個…

分割表の位置・自由度・座標変換1 記載方法

こちらの書き直し 記載方法 表関係 は、次元分割表の各次元のカテゴリ数の集合である 表のセルの総数は 個の尺度の集合をとする 分割表は次元アレイであるが、すべてのセルをベクトルで表すことにし、観測テーブルのベクトル、その期待値のベクトルを、それ…

分割表の位置・自由度・座標変換3 正単体・複体の2段階階層構造の頂点座標

正単体の頂点座標 個の頂点を持つ正単体の頂点座標は次元空間上の点として表される (全頂点ベクトルの和はゼロベクトル) (すべての頂点ベクトルのノルムは等しい) (すべての頂点ベクトルペアのなす角は等しい) これらの頂点は、ある1つの尺度のカテゴリに対…

分割表の位置・自由度・座標変換2 分割表における正単体と複体

分割表では、正単体として扱われるものが2種類ある (1) ある尺度は個のカテゴリを持つ。これらのカテゴリは相互に対等な関係にある。また、すべての標本は個のカテゴリのいずれか1つに属することから、個の頂点を持つ正単体の内部と表層とが、標本分布の存…

分割表の位置・自由度・座標変換5 分割表の正単体・複体座標表現(2)

できたようだ… 関数 library(sets) library(igraph) # 制約条件Facesから、Facets(Facesの包含関係から、最大化した部分正単体の集合としたもの)を作る MakeFacets<-function(Faces){ Subs<-outer(Faces,Faces,FUN="set_is_proper_subset") diag(Subs)<-FALS…

駆け足で読む『Lectures on Algebraic Statistics』再び 2. Likelihood Inference

目次はこちら 放物線などが出てくる これと重なる・つながる