2007-10-01から1ヶ月間の記事一覧

ベイズ因子 Bayes factor メモ

尤度をモデルを構成するパラメタの分布範囲について積分して求めたもの。パラメタの事前分布をいじると複雑に・・・。 尤度比検定では、モデルを構成するパラメタについて、最尤推定値を用いる点と、尤度比から得られる統計量をカイ自乗分布にてP値化する点…

メモ

青木先生ページ

書きかけ

カイ自乗分布 カイ自乗値がとなる確率は自由度について、 ,,,,,... ,で、 と一般化して書かれる。 自由度1、2、3については、次の通り。 例:自由度1のカイ自乗分布は、において、その確率は これをRを使ってプロットしてみる。 まず、カイ自乗値として…

メモ

R行列記事 行列を特定の列(のリスト)でソート(こちら) 添え字操作の記事(こちら) x y cx cy dx dy prodD sumC d2 plot(prodD) plot(sumC) plot(d2) 行列の列の和をとる、行の和をとる、colSums(mat),rowSums(mat)※FUNは大文字 行列の行入れ替え、列入れ替え …

メモ

> r1 > r2 > c1 > c2 > d1 > d2 > dmult > c12 > d12 > x12 > plot(dmult,x12)

多重検定を重層的に繰り返したとき(6)Mantel-Haenszelは自由度=層数のカイ自乗統計量の1次元投影量である

この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして…

複数の多テストスタディの累積(6)

構造化集団データにおけるランダマイゼーションテスト(論文紹介)

論文 A randomization test for controlling population stratification in whole-genome association studies. Kimmel G, Jordan MI, Halperin E, Shamir R, Karp RM. Am J Hum Genet. 2007 Nov;81(5):895-905■ 方法 ●大規模SNPジェノタイプデータをもとに…

多重検定を重層的に繰り返したとき(5)

この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして…

多重検定を重層的に繰り返したとき(4)

この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして…

多重検定を重層的に繰り返したとき(3)

この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして…

複数の多テストスタディの累積(3)

多重検定を重層的に繰り返したとき)(2)

この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メモとして…

多重検定を重層的に繰り返したとき

未証明→ この日の記事の問題点は 『統計量を考えたこと』 独立事象について、生起確率を掛け合わせることと、P値(生起確率の累積)を掛け合わせることとは別物であるから。以下の記述は、この点について問題があることに留意しつつ、積分その他については、メ…

複数の多テストスタディの累積

覚書coplot

R

今、1行目にヘッダーがあるエクセルファイルがn列あって、そのn(n-1)/2組合せのすべてでcoplotを並べる必要があるとする。 タブ区切りファイル "sample.txt"に保存する。 TypeA TypeB TypeC 0.891279841 0.648418201 0.821788067 0.734244145 0.646355196 0…

2次元配置coplot with R

自由度2のジェノタイプ検定のカイ自乗統計量とトレンドテスト統計量

今、 で表されるモデルを考える。このモデルのが2x3表のカイ自乗統計量に一致する。 それは、両方の計算式がに変形できることで示される。 また、は、をの関数としてとらえたときに、の解であることも示せる。は、分母・分子ともにの2次式であり、その値は…

優性モデル・劣性モデルとトレンドテスト統計量

優性モデルでは、アレル a の所有数が1、2のときを均等に扱い、劣性モデルでは所有本数が0,1のときを均等に扱うから、それぞれの重み付けは, は適当に式変形することにより、であることが示せる。 他方、優性モデルにおいて、作った2x2分割表は AAAa…

いわゆるトレンドテスト(additive model)

additive modelでのトレンドテスト統計量は、のように、3ジェノタイプに均一間隔の重みをつけたものである。としてもとしても、としても均一間隔である限り統計量は変わらないことに注意する , したがって、

トレンドテスト

ここでトレンドテストにおける、3ジェノタイプに与えるweightを,と置いても一般性を失わないので、そのように置くことにすると、トレンド統計量は、その定義から ただし、 書き換えて ,ただし、, は、3種類のジェノタイプが作る3つのペアについて、その観…

2x3分割表

今、2x3観測分割表を AAAaaasum caser controls sumn と置く。アレル a の本数を添字数は表すものとする これから、case, controlが独立であるときの期待値の表を作り、次のように表す AAAaaasum caser controls sumn ここで, さらに、観測度数と期待値と…

2x3分割表検定のまとめ

2x3分割表 トレンドテスト いわゆるトレンドテスト(additive model) 優性モデル・劣性モデルとトレンドテスト統計量 自由度2のジェノタイプ検定のカイ自乗統計量とトレンドテスト統計量

2x3分割表カイ自乗統計量

SNPジェノタイプにおける2x3ジェノタイプ分割表について、その周辺度数に対して、とり得るすべての分割表のパターンを a b c d e fのa,cを変数としてプロットして眺める用事ができた。昨日のRのpersp関数や、エクセルの等高線プロットもよいが、角を丸め…

カイ自乗統計量のお絵かき

persp関数

R

こちらのサイトはお薦めで。 たとえば、2次元スプレッドシートに値が入っているとする。エクセルで鳥瞰図を描くとすると、領域を選んでグラフ→等高線、と進むところ。 Rでは・・・。 タブ区切りで2次元スプレッドシートタイプのファイル、"data.txt"がある…

Rの3次元鳥瞰図 persp関数

N次元空間から見たカイ自乗分布の自由度

多次元球、N次元球の復習 N次元球とは、N次元(ユークリッド)空間において、ある点からある距離以下の点の集合であり、N次元球の表面は、ある点からある距離の点の集合である。 半径のN次元球の表面積は、 半径のN次元球の体積は、 今、次元と次元,の球を考え…

メモ

Sratio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*pi^((df2-df1)/2) pchiRatio<-function(df1=df1,df2=df2)gamma(df1/2)/gamma(df2/2)*(1/2)^((df2-df1)/2) SratioPchiRatioRatio<-function(difdf)Sratio(1,1+difdf)/pchiRatio(1,1+difdf) plot(…

Rで計算 n次元球

関連記事 ガンマ関数 gamma(a) 表面積 ndgsphereS<-function(df=df,r=r) 2*pi^(df/2)*r^(df-1)/gamma(df/2) ndgsphereV<-function(df=df,r=r)r/df*ndgsphereS(df,r) ndgsphereV(df=3,r=1) [1] 4.18879