相対危険度と閾値モデル

R 閾値モデル

今、prevalence=prev, リスクアレルホモの非リスクアレルホモに対する相対危険度がrであるとする今、この着目SNP以外の要因が平均０、分散１の正規分布であるとする閾値モデルで、閾値Tにて発病するとすると、Tとpの関係は、Rの関数を使えば、T=qnorm(p=1-…

2009-08-28

JGraphT

Java グラフ

JGraphTは、Javaのグラフライブラリこちらの記事を参照ちなみにこの記事を載せたブログの管理者さんは、英語のチェックのこんなのもやっているし、Hatenarというサービスも管理しているとか。。。それによると、このryamada22ブログはこんな感じと。世の中…

2009-08-27

リスクSNPの強さを分散ベースで評価してその検定パワーを計算する

Java 公開アプリケーション

講義説明用のツール。たとえば以下のような条件を考えます(掲載図) 広義Heritability=0.6 着目SNPのアレル頻度は0.4 このSNPは遺伝因子全体の1％を説明する程度のものであってこのSNPは集団でHWEを満足しておりこの疾病のphenocopy=0.2で有病率が0.01 こ…

2009-08-27

リスクSNPの強さを分散ベースで評価してその検定パワーを計算する

2009-08-26

半自動で回す

gnuplot 3D

図を回転させるには、視点を変える必要がある。ずーっと回し続けるには、視点を元に戻す必要がある。 GIFのファイルは、複数のGIFをまとめて１ファイルにすることで、パラパラ画像にすることができる。パラパラ画像には、パラパラめくるときの順序と、速さの…

2009-08-26

3Dプロットを半自動で回す

gnuplot 3D 集団構造化 R

昨日の続きこちらを参照。少し変えてあります。２つのファイルを用意します。"File1.plt"と"File2.plt"の２つです読み込みますので、カレントディレクトリに置いておくのがよいです。 "File1.plt"は以下のように、初期設定をして、繰り返しプロットをする…

2009-08-26

その２　gnuplot for windowsで３次元プロットをぐるぐる回す

2009-08-25

■

gnuplot 3D 集団構造化 R gnuplot 3D 集団構造化 R

昨日の続きケース・コントロールの２群が構造化のある集団からサンプリングされ、その構成にずれが生じているようなときに、そのサンプル２群のずれの方向にアレル頻度の勾配があるマーカーでのテストと、そのずれの方向とは直行する方向にアレル頻度の勾配…

2009-08-25

gnuplot for windowsで３次元プロットをぐるぐる回す

2009-08-24

上がったり下がったり

集団構造化

構造化集団からのサンプルにおいて、多数の検定を行い、それを補正する場合、統計量のインフレーションとそれに伴うｐ値の低下を均並みに補正することもあれば、統計量のインフレーションの原因である構造化から情報を抽出して個々の検定ごとに補正すること…

2009-08-23

構造化集団多次元空間その２

R

アレル頻度を多次元空間に法線ベクトルとそのベクトル上の「中央点」をとり、その方向について、単調増(減)のアレル頻度分布をにて与える個体は多次元空間の点においてＨＷＥを満足すると仮定するサンプリングは多次元空間上において(正規)確率密度で行わ…

2009-08-22

構造化集団多次元空間

R

アレル頻度を多次元空間に正規分布を使って与える個体は多次元空間の点においてＨＷＥを満足すると仮定するサンプリングは多次元空間上において(正規)確率密度で行われる異なるサンプリング集団間における集団構造の違いは、サンプリング確率密度分布のず…

2009-08-21

sample関数 cbind関数

R

入力値 Nm:マーカー数 p:マーカーごとのアレル頻度。以下の例では、0-1の一様乱数でランダムに振ってある f:マーカーごとのディプロタイプ頻度に関するHWEからの逸脱度 r:マーカーごとのリスクの強さ。以下の例では、平均0、標準偏差0.01で振ってある。すべ…

2009-08-20

講義で教える、『お手軽マンハッタンプロット』

R GWAS

ゲノムワイドの関連検定データが出たとする。DNA上の物理位置を横軸に、関連検定統計量を縦軸にプロットするのはルーチン。ルーチンはだれでもできることが望ましい（できれば自分でやらずにだれかにやって欲しい…）次のようなファイルがテキストファイル…

2009-08-19

母関数　数列　確率分布　積率母関数　特性関数　その２

母関数

数列・確率分布における母関数がこのブログの取り扱い範囲内。このブログの取り扱い範囲外での母関数のことは（ひとまず）無視する母関数・生成関数(Generating function)はある数値の並びを算出してくれる関数有限個の数値の並びなら、ある意味で簡単。書…

2009-08-18

母関数　数列　確率分布　積率母関数　特性関数

母関数

母関数は無限級数とそれに対応させた不定元の冪乗を含む関数(重み付け関数,kernel)とで表されたもの。(たいていは)無限個の項を使わない式表現がある。母関数の種類(kernelの違い、kernelのタイプにより以下に分類される) 通常型母関数指数型母関数ポワソ…

2009-08-17

下降階乗からHaskellへ

Haskell

Ewens sampling formulaから調べ物をしていると階乗、下降階乗・上昇階乗などのサイトを閲覧することが増える。さらにその関連で第一種スターリング数、第二種スターリング数などもよく使う。また、確率密度関数とはそもそもなんだっけ、そしてその教科書の…

2009-08-16

再整理

統計遺伝学

このブログはいろいろなウェブコンテンツと相互リンクを張っている。ときおり、整理を試みるも、すぐに、収集がつかなくなる。新しい相互リンク先が京大統計遺伝学分野Wiki(こちら)。それぞれのリンク先もサーバ引越などを繰り返しているが、現時点での最…

2009-08-15

同胞は親子よりも似ている

量的形質 Dominance

Covariance between relatives additive varianceは家系図的距離で効いてくる dominace varianceは家系図にループがあるときに効いてくる Full siblingsの場合、sib1->mother->sib2->father->sib1のループがある Double first cousinsの場合、cousin1(c1)->c…

2009-08-14

Ewens sampling formulaを遺伝現象的に説明し直す

Ewens sampling formula 整数分割 Java

Ewens sampling formulaは以下の式で表され、 [tex:Pr*1=\frac{n!\theta^k}{\theta^{\[n\]}}\prod_{i=1}^n \frac{1}{i^{m_i}m_i!}], このような式であらわされるような突然変異の係数について、サンプル数nのときの、異なるアレルの数の期待値は[tex:\sum le…

2009-08-13

分割の個数を出す

Ewens sampling formula 整数分割 Java

Ewens sampling formulaについて数日前に書いた。それは、ある正の整数を正の整数の和で表す表し方と関係していることも書いた。このように整数を整数の和で表すことを整数分割という。それについては、こちらを参照。その整数分割のパターン数をJavaでべ…

2009-08-12

最強力検定

Optimal discovery procedure Multiple testings

単独検定のときの最強力検定については、Neyman-Pearson の補題を参照（こちら）多仮説検定のときは事情が異なる FDRはその解決策の一つ Optimal discovery procedureもその延長線上 False positive数を与え、その条件でTrue positive数を最大化する Optima…