2008-01-01から1ヶ月間の記事一覧

すべての場合

雑な考察: 0と1のみからなるk桁の数値列は全部で通りあり、それらが1サンプルずつあるとする。 通りの、相互に異なる数値列を個別のカテゴリとみなしたときの、2x分割表のカイ自乗値は。 この表を自由度で評価するとき、そのp値はにおいて0.5に収束す…

NQSでシンプルなコマンド列ファイルから実行する

NQSという並列ジョブ管理の仕組みがある。 ジョブを #!/bin/bash commandXのようなファイルを作り(command.shとか) # qsub command.sh(qsubコマンドのオプションは省いてある) のようにジョブを発行すると、"commandX"というコマンドのジョブを適当に割り振…

カイ自乗値とalpha値から相当する自由度を求める

今、カイ自乗値がyのとき、自由度dの棄却検定を行って、タイプ1エラーがaであるとなるとする。 Rの関数を使えば、 a<-pchisq(y,d,lower.tail=FALSE)という関係である。 今、aとdが与えられているときに、yを求める関数もRにはあって、 y<-qchisq(a,d,lower.…

集団構造化評価によるはずれサンプルの取り扱いの影響

Eigenstratというアプリケーションがある。Principal Component AnalysisベースのゲノムワイドSNP関連解析ツールである。 さて、このアプリケーションでは、PCAによって個人を集団構造特性の中の位置として表すが、その結果、過度に外れた位置にあるサンプル…

任意精度

昨日、超幾何関数の数値計算で表を掲載した。そこでは、n回の試行のうちの成功回数をk回としていたが、実は、kが整数であると、昨日の超幾何関数を含む式の結果は発散してしまう。そこで、ちょっとトリックを入れて、k(整数)にちょっとだけ下駄をはかせて、…

パーミュテーションテストの打ち切り:ベルヌーイ試行尤度積分(4)〜Mathematicaで計算

先日来、こんな記事、こんな記事、こんな記事を書いた。 今、ある多数の仮説検定を行い、マルチプルテスティングの補正をする前の段階でという値が得られているとする。 モンテカルロパーミュテーションにて、最小P値を得るとき、n個の最小P値を得たところ、…

ベルヌーイ試行での尤度の積分(4)

ベルヌーイ試行尤度積分(3)〜Mathematicaで計算

先日、こんな記事を書いた。 こんな記事も書いた 今、生起確率pであるような事象について、n=1,2,...,100回、繰り返して実行したところ、そのような事象がk=0,1,2,...,10回、起きたとする。この生起確率がであるような確率が、ガウスの超幾何関数の商で表さ…

ベルヌーイ試行尤度積分(2)〜FWERとの関係

先日、こんな記事を書いた。 今、確率pで生起するベルヌーイ試行を考える。このような試行をn回繰り返したときに生起した回数をk回とする。この生起確率は、である。 pが知られていないときに、n回の試行でk回生起したとする。pがである尤度はである。 ここ…

確率分布公式集

リンク

リンクページ

ikuro's-homepageの佐藤郁郎さん

ベルヌーイ試行尤度積分

今、確率pで生起するベルヌーイ試行を考える。このような試行をn回繰り返したときに生起した回数をk回とする。 このような起こり方は、である。 pが知られていないときに、n回の試行でk回生起したとする。pがである尤度はである。 ここから、であるのかそう…

近似

母集団がN、それがM個とN-M個の2タイプ(タイプA、タイプB)に分かれるとき、n個をサンプリングしてx個がタイプAでn-x個がタイプBであるような確率は、超幾何分布。 。 エクセルではHYPGEOMDIST(x,n,M,N)として計算する。 超幾何分布は計算が面倒くさい 今、n…

後で見るメモ

シリーズ概説リンク シリーズトップページリンク

お試し並列処理〜細工〜擬似乱数列の管理

パーミューテーションテストでモンテカルロを使うとすると、並列プロセスで用いる擬似乱数列も相互にランダムであることが必要である。シードから開始する擬似乱数列を用いる場合には、採取する擬似乱数を、プロセス数おきに採取させることによって、全プロ…