2006-12-01から1ヶ月間の記事一覧

多次元度数分布

通常の度数分布(尺度がひとつ)の度数分布をさらさらと標準出力で描きたいことはよくある。さらに、多次元のdouble型データから、次元別に件数をカウントしたいこともある。"DiscreteMathTools.Tensor"はこちら。 2次元尺度の度数をプロットするには、3次元…

シミュレーション

12月27日の記事で、互いに近い亜集団のSNPアレル頻度をfを用いてシミュレーションすることを書いた。 隔離された期間のあるような亜集団間では、このシミュレーションだけではうまく行かない。たとえばHapMapプロジェクトで見られるアジア2民族(日本人…

SNPにおけるgenomic control補正でのカイ自乗分布の対数対数プロット

Genomic controlは構造化のある集団において得られる統計量を、その集団において観測する多数の帰無仮説OK仮説からの統計量の分布を用いて補正するという考え方で、ここ数週間のこの日記の主要テーマの1つとなっている。 さて、簡単に言うと、構造化の影響…

てふでの苦労

Texで文書を作り始めて、数式表記の苦闘から解放されたと喜んだのもつかの間、今度は、TeX形式で受け付けてくれないもろもろの相手にどうやって渡すか、という問題で苦労する。このはてなダイアリーは、ブログにおけるてふ表現の苦労からの解放であったわけ…

構造化集団のシミュレーション

Genomic controlのレビューを紹介した(記事はこちら)。その中で、構造化集団の構造化の程度をfで表し、それを用いて、集団のHWEから外れたジェノタイプ頻度の計算と、構成亜集団のアレル頻度のばらつき具合についての記載があった。 平均アレル頻度pに対して…

構造化集団における個人の2アレルの共分散とFixaton index

HWEにある集団のアレル頻度pのSNPの3ジェノタイプ頻度はである。今、これからのずれをとあらわす。ここではFixation indexである。 今、このような集団の個人のもつ2アレルにつき、その関連の強さを共分散であらわす。第1のアレルがAである確率は、第2の…

2項分布の正規分布近似と尤度比検定

たぶん、式変形はあっています。 確率pでおきる事象のN回の独立試行で、X回起きる確率は、である。今、Nが十分に大きく、pが小さすぎないとき、正規分布に近似して、と表される。今、観測データからモーメント法で算出した事象の生起確率の期待値はであるか…

不均一確率密度分布からのN回サンプリングの最小値について(改変版)

上記の記事を利用して、累積確率密度分布がなる統計量(最小値が0、最大値が1)の期待値、および、それをN回ランダムに繰り返したときに得られる最小の統計量の期待値を求めてみる。 N回ランダムに繰り返したときに、以下の値が1回もない確率はである。少な…

累積確率密度関数から統計量の期待値

今、最小値をmin、最大値をmaxとして持つような統計量Vがあるとする。その確率密度分布はminからmaxの範囲に定義されていて、と表されるとする。この統計量の期待値はである。 今、部分積分の公式と、とを思い出せば(リンク)、 Q(v)は累積密度関数であるから…

両対数グラフの直線と累乗

思い出すこと。 データをプロットする。両対数グラフを描く。増加直線になったとする。 両辺をEの累乗をとると 今、であるから

累積確率密度分布関数の近似

12月11日の記事で、線形近似式が出てきて、その式が、多項展開とその積分の便宜のために、ちょっと複雑になっていた。 また、累積密度関数の近似式を得る作業の途中であり、(0,0),(1,1)を通るような線形近似式を得るためのソースが必要になっている。 準備1…

不均一な集団からのデータ解釈への拡張

ここは部分積分を用いるともっとずっと簡単でした→こちら 12月5日に、均一分布からのN回サンプリングの最小値の期待値についての記事を、12月7日にその拡張である、N回サンプリングのときの第k番目の値の期待値についての記事を書いた。 今日の記事は、不均…

P値を昇順ソートしたときのその期待値について

12月5日の記事(こちら)に、N回の独立検定を行ったときに得られる最小P値の期待値がとなることを示した。今日の記事では、同様に行ったときに得られる、第k番目に小さいP値の期待値がとなることを示す。 均一な確率密度分布はで与えられる。 N回の独立サンプ…

最小P値の分布

均一な確率密度分布はで与えられる。 N回の独立サンプリングをしたときに以下の値が1回以上起きる確率は、FWERの考え方から示される通り、 (記事はこちら) 今、N試行中、が最小値であるということは、以下の試行が1回以上であって、以下の試行が0回である…

複数の分割表検定を併せる

同一の仮説について複数のデータが得られたときに、それを総合して検定をしたいことがある。メタアナリシスは、複数の同様な発表データを総合する手法で、発表データの同定の適切性など、結果の信頼性を確保するには、それ特有の問題があるが、今、その点は…