分割表

0の行・列を縮める

複数のカテゴリカル変数が作る、多元表があって、各変数の周辺度数が0になっているかもしれない(のだが、元の多元表の形で考えていたい)とき、表を縮めたり(そのあと、縮めることで処理が容易になることをしたり)、いったん縮めた表を元の形に戻したりしたい…

論文メモ

分割表関連の英語表現を参照するための論文(こちら) Data augmentation in multi-way contingency tables with fixed marginal totals

SNP分割表〜オミックス統計学入門2014

こちらの続き SNPのケースコントロール分割表のための配布資料 これで90分1回分か2回分と予想 以下はRmdフォーマット。knitrするとhtml化、epub化できます(もちろんフリー)→こちら) その手間を惜しむ人向けにKindleサイトを利用中(こちらにほどなく現れる予…

オミックス統計学入門2014

京都大学大学院医学研究科の修士対象講義は、2012年度に「インフォマティクス」2013年度に「統計学処理の基礎概念」を扱っています。2014年度は、遺伝疫学やオミックスデータ解析の論文の主張を読み取ったり、それを臨床展開することを念頭に置いた「解析初…

検定・推定・情報量・エントロピー(続き)

こちらの続き 線形回帰と分散分析とで順序関係が等しくなる統計量のことをやっていた 1元配置分散分析で2群のときは、線形回帰そのものだった 1元配置分散分析で3以上の群のときは群内分散・群間分散の割り振り具合と群の数(もしくはそれより1つ少ない…

検定・推定・情報量・エントロピー

こちら(ヒストグラムと情報量)の続き これは、ヒストグラムを推定分布とみなして、その分布の情報量のこと、それと分割表の独立を仮定した生起確率・独立性検定統計量のことをメモした記事 最大エントロピー原理(Wiki)の記事にあるように「情報を得る前」の…

極限まで分割する

2x2表があるとき、その生起確率は。周辺度数が固定しているときに比例している 2つの1次元確率密度分布があるとする。2つの分布に従って生起する事象のペアがあるとする。ペアになる事象が独立であるかそうでないかを考える。独立でない場合には、「偏…

全列挙

1番じゃなきゃシリーズでは、モンテカルロな評価と、正確確率的な評価の両方が面白い 正確確率的な評価には起こりうるすべての表をすべて挙げたい こちらでそれをうまくやるために図形数とかも考えてみたけれど、図形数として扱いやすいのはユークリッド座…

ぱらぱらめくる『Algebraic geometry of 2x2 contingency tables』

この本の第3章 Algebraic and Geometric Methods in Statistics作者: Paolo Gibilisco,Eva Riccomagno,Maria Piera Rogantin,Henry P. Wynn出版社/メーカー: Cambridge University Press発売日: 2009/10/22メディア: ハードカバーこの商品を含むブログを見…

決断ヒストリーのシミュレーション

約1か月前、決断の話を始めた(こちら) ●は赤を出して勝ち、○は赤を出して負け、■は青を出して勝ち、□は青を出して負けとした ●●○○■○■■■□●●□●○○■■□□□● こんな●■○□の並びが、「決断過程」として妥当な感じがするかどうか、とか、妥当って何か、とかそんなとこ…

メモ

ps <- c(0.2,0.8) N <- 30 library(combinat) calc.survival.2 <- function(X){ ret <- 0 for(i in 1:length(X)){ tmp <- expand.grid(0:(length(X[[i]][,1])-1),0:(length(X[[i]][1,])-1)) tmp.2 <- apply(tmp,1,sum) ret <- ret + sum(tmp.2 * X[[i]]) } r…

2x2表:ぱっと見て感じる

2x2分割表のクイズ 実行すると、2x2表に対応する棒グラフがいくつか並べて提示される 図を先送りすると、そのフィッシャーの正確確率検定p値が表示され、最小p値の棒グラフがハイライトされることで、答え合わせができる Q『次の3つの棒グラフに対応…

分割表を代数統計する

2x2表をSingular でやってみよう x+y=p1,z+w=p2,x+z=q1,y+w=q2とする(p1,p2,q1,q2が周辺度数) ring p = 0,(p1,p2,q1,q2),lp; ring x = 0,(x,y,z,w),lp; setring p; map f = x,p1*q1,p1*q2,p2*q1,p2*q2; ideal i0 = 0; setring x; preimage(p,f,i0); これは前…

分割表とトーリックイデアル

こちらでもリンクしたこちらの話しの自分なりのリ・フレーズ イデアルについてはこちらを k次元分割表があって、第i軸のカテゴリ数がで、表全体として個のセルがある log-linear modelでの各セルの頻度は,ただしは第i軸の第カテゴリの頻度で表される ある観…

メモ

CategoryVector<-function (nc = 3){ df <- nc - 1 d <- df + 1 diagval <- 1:d diagval <- sqrt((df + 1)/df) * sqrt((df - diagval + 1)/(df - diagval + 2)) others <- -diagval/(df - (0:(d - 1))) m <- matrix(rep(others, df + 1), nrow = df + 1, byr…

分散の偏り

遊び 2x2分割表がある カイ二乗統計量を計算することが多い 群内分散と群間分散とも計算してその比をとったりしてみよう n.iter <- 1000 chis <- ss <- ss2 <- rep(0,n.iter) v <- sample(100:500,4) m <- matrix(v,2,2) a <- apply(m,1,sum) b <- apply(m,2…

プレゼンテーションに挑戦

明日から神戸でIBC2012が始まります。(こちら) 仲間内からは、多次元分割表の代数統計的取扱いとDNA鑑定に線形代数とその統計量の近似計算法とがテーマとして発表される予定です 特にチャレンジングなのは弱冠二十歳でのオーラルプレゼンテーション(多次元分…

ディリクレ分布とカイ自乗分布とその歪み

総数を固定しなくても… メモ は (スターリングの公式)より であって に注意したり、,に注意したりして変形すると この式の移行関係には、対数尤度比がカイ自乗分布に従うという話がある k <- 5 library(MCMCpack) f <- c(rdirichlet(1,runif(k))) N <- 10000…

メモ

2項分布の連続化:β分布 多項分布の連続化:ディリクレ分布 確率ベクトル、観測度数, 確率 に制約をつけつつ、確率を最大にするようなが知りたいとする Rのoptim()関数で最適化することにする 少し普通ではない変数の置き方をする 長さのベクトルを考える …

メモ

LIMITED INFORMATION GOODNESS-OF-FIT TESTING IN MULTIDIMENSIONAL CONTINGENCY TABLES 分割表の場合(こちら) Exact Conditional Tests for Hierarchical Models in Multidimensional Contingency Tables

コドン表

# 塩基を数字で表す base<-1:4 # 塩基名を文字で表す base.name<-c("T","C","A","G") # アミノ酸を数字で表す # stop codonを21番とする aa<-1:21 # アミノ酸を文字で表す # stop codonは"X"とする aa.name<-c("F","L","S","Y","C","W","P","H","Q","R","I",…

DNA鑑定を表した分割表

こちらでDNA鑑定の話しをしている 一部の標本について情報が得られたという条件を与えて、条件付き確率を計算して、それを尤度に持ち込んでいる 「統計」らしく、分割表の枠組みで考えることにしよう ただし、多次元 多次元分割表の話しはこちら 雰囲気とし…

格子座標を正単体座標へ

k個の量的尺度があって、サンプルについてk個の値のセットが観察されているとする サンプルはk次元空間の点に対応させることができる こちらでやっているように、代数統計的に考えると、k個の尺度の2値分割表()は、軸の集合のべき集合に分解して考えること…

分割表の位置・自由度・座標変換のまとめ 分割表の正単体・複体座標表現によるカイ二乗検定

こちらの整理記事 次元の表がある th()次元のカテゴリ数をとする のセルの総数はである には、複体で表される周辺度数制約がある ここでは(正)単体であり、の頂点はの部分集合である による周辺度数制約とは、が作る、の部分表に相当する周辺度数が与えられ…

分割表の位置・自由度・座標変換4 分割表の正単体・複体座標表現

多次元分割表の尺度別カテゴリ数がであるときの、表のセルの総数はである このような表にの行列を次のように与える 個の尺度の集合のべき集合の個の要素ごとに、それらが作る複合カテゴリ個に対応させた、長さのベクトルが算出されている 元の次元分割表の個…

分割表の位置・自由度・座標変換1 記載方法

こちらの書き直し 記載方法 表関係 は、次元分割表の各次元のカテゴリ数の集合である 表のセルの総数は 個の尺度の集合をとする 分割表は次元アレイであるが、すべてのセルをベクトルで表すことにし、観測テーブルのベクトル、その期待値のベクトルを、それ…

分割表の位置・自由度・座標変換3 正単体・複体の2段階階層構造の頂点座標

正単体の頂点座標 個の頂点を持つ正単体の頂点座標は次元空間上の点として表される (全頂点ベクトルの和はゼロベクトル) (すべての頂点ベクトルのノルムは等しい) (すべての頂点ベクトルペアのなす角は等しい) これらの頂点は、ある1つの尺度のカテゴリに対…

分割表の位置・自由度・座標変換2 分割表における正単体と複体

分割表では、正単体として扱われるものが2種類ある (1) ある尺度は個のカテゴリを持つ。これらのカテゴリは相互に対等な関係にある。また、すべての標本は個のカテゴリのいずれか1つに属することから、個の頂点を持つ正単体の内部と表層とが、標本分布の存…

分割表の位置・自由度・座標変換5 分割表の正単体・複体座標表現(2)

できたようだ… 関数 library(sets) library(igraph) # 制約条件Facesから、Facets(Facesの包含関係から、最大化した部分正単体の集合としたもの)を作る MakeFacets<-function(Faces){ Subs<-outer(Faces,Faces,FUN="set_is_proper_subset") diag(Subs)<-FALS…

座標を与える

この記事は、こちらに書き直しました 2次元分割表のセルに自由度次元空間のベクトルを対応付ける話は、こちらでした こちらでは代数統計学の一環として、多次元分割表の取扱いについてメモした 外積代数については、こんなメモもした さて、これらをつなげて…