カイ自乗
ある少なくない標本数で、多数のマーカーを調べ、マーカーについて検定を繰り返すことが、GWASでは行われる 言い換えると、巨大な(標本数xマーカー数)の疎な観測テーブルについて、多数の低自由度検定を実施していることになる この論文で示したように、こ…
n次元分割表を考える。その分割表は総数が1となるようにセルの値を標準化してあるものとする。 2次元の分割表NxM (N n次元に拡張する。次のような特殊なサイズとする。 NxNx...xNxM M>=Nなる多次元分割表(すべての次元の長さが等しいか、そうでないならば…
NxMテーブルがあり、そのセルの値を、その周辺度数をと表し、独立仮説における期待値をとすれば と書き表すことにすれば、 この式は、テーブルの各セルのとりうる範囲が、テーブルの周辺度数によって変化することを、によって調整した上での、各セルの成分を…
カイ自乗値は一般に以下の形をしている ここで、は分割表のセル数、は、各セルの観測値と期待値の差(観測-期待差)、は期待値を表すものとする この形は次元楕円である(k次元単位球を、各次元の方向に倍、引き伸ばしたもの) 等しいカイ自乗値をとるは、-次元…
public static double PrRatioChiPrExPrAllDF(double[][] d){ int df=(d.length-1)*(d[0].length-1); System.out.println("df=\t"+df+"\t"); //(ExPr/ChiPr) double ret = 1; double chi=Chi.chi(d); if(chi!=0){ double chiPr=0; double expr=0; double chi…
n行m列の分割表(がある。今、第1列から、第m-1列は、第1行にのみ非0の値が入り、残りの行は0であり、第m列は、第1行の値が0で、残りの行には非0の値が入っているような、0ばかりの表があったとする。このような表のカイ自乗値はサンプル総数に一致する。 今…
今、2x2分割表があり、サンプル総数を、縦軸の比率が、横軸のそれがとする。また、2x2のセルの観測値をとする。 である。自由度1のカイ自乗分布において、そのとなる確率密度は、で与えられる。 一方、このテーブルの正確生起確率はで与えられる。 こ…
カイ自乗分布 カイ自乗値がとなる確率は自由度について、 ,,,,,... ,で、 と一般化して書かれる。 自由度1、2、3については、次の通り。 例:自由度1のカイ自乗分布は、において、その確率は これをRを使ってプロットしてみる。 まず、カイ自乗値として…
> r1 > r2 > c1 > c2 > d1 > d2 > dmult > c12 > d12 > x12 > plot(dmult,x12)
今、 で表されるモデルを考える。このモデルのが2x3表のカイ自乗統計量に一致する。 それは、両方の計算式がに変形できることで示される。 また、は、をの関数としてとらえたときに、の解であることも示せる。は、分母・分子ともにの2次式であり、その値は…
優性モデルでは、アレル a の所有数が1、2のときを均等に扱い、劣性モデルでは所有本数が0,1のときを均等に扱うから、それぞれの重み付けは, は適当に式変形することにより、であることが示せる。 他方、優性モデルにおいて、作った2x2分割表は AAAa…
additive modelでのトレンドテスト統計量は、のように、3ジェノタイプに均一間隔の重みをつけたものである。としてもとしても、としても均一間隔である限り統計量は変わらないことに注意する , したがって、
ここでトレンドテストにおける、3ジェノタイプに与えるweightを,と置いても一般性を失わないので、そのように置くことにすると、トレンド統計量は、その定義から ただし、 書き換えて ,ただし、, は、3種類のジェノタイプが作る3つのペアについて、その観…
今、2x3観測分割表を AAAaaasum caser controls sumn と置く。アレル a の本数を添字数は表すものとする これから、case, controlが独立であるときの期待値の表を作り、次のように表す AAAaaasum caser controls sumn ここで, さらに、観測度数と期待値と…
2x3分割表 トレンドテスト いわゆるトレンドテスト(additive model) 優性モデル・劣性モデルとトレンドテスト統計量 自由度2のジェノタイプ検定のカイ自乗統計量とトレンドテスト統計量
SNPジェノタイプにおける2x3ジェノタイプ分割表について、その周辺度数に対して、とり得るすべての分割表のパターンを a b c d e fのa,cを変数としてプロットして眺める用事ができた。昨日のRのpersp関数や、エクセルの等高線プロットもよいが、角を丸め…
多次元球、N次元球の復習 N次元球とは、N次元(ユークリッド)空間において、ある点からある距離以下の点の集合であり、N次元球の表面は、ある点からある距離の点の集合である。 半径のN次元球の表面積は、 半径のN次元球の体積は、 今、次元と次元,の球を考え…
Sratio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*pi^((df2-df1)/2) pchiRatio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*(1/2)^((df2-df1)/2) SratioPchiRatioRatio<-function(difdf)Sratio(1,1+difdf)/pchiRatio(1,1+difdf) plot(…
ガンマ関数を用いたカイ自乗分布の確率密度関数は、カイ自乗値について 両者の比は このは、正方形に内接する円の円周の長さと、その正方形の向かい合う2辺の長さの比にカイ自乗値をかけたものの平方根なのだが・・・この後、このPr(df1),Pr(df2)の混合分布…