2005-05-01から1ヶ月間の記事一覧

Dirichlet分布、ぼーず確率

ぼーず確率については、ryamadaの遺伝学・遺伝統計学メモ - Coalescence発生待ち時間の算出で書いたが・・・。その発展編。 Dirichlet分布一般については、関連記事(こちらとこちら)も参照。 ながらくイメージのつかめなかった、Dirichlet分布がようやくわか…

染色体履歴のJavaクラス管理

Java勉強会ryamadaのコンピュータ日記でゼロからJavaアプリケーションの作成を勉強している。 今、2倍体生物の有性生殖における染色体の履歴を発生するプログラムをkuma_the_seal君が作っている。僕は、それを流用するべく、少し別のことも考えている。まだ…

Perfect Phylogeny HaplotypingとGraph Realization problem

Diploidのジェノタイプデータから、ハプロタイプを推定する方法はいくつか(も)知られているが、そのようにして推定されたハプロタイプが、「ARG(Ancestral Recombination Graph)を描けるか=祖先ハプロタイプからのCoalescenceとRecombinationとからできてき…

dviout for Windowsの設定

テキストエディタによってLaTeX形式の記載をし、数式などを多用した文書を作る。実際にそれをPDF化したり、PDF化したらどう見えるかを確認したりするためのWindows用アプリケーションがdviout for Windowsである。Vector Vector Softライブラリ などの DLペ…

Newick書式から系統樹を描く

系統樹を描くための情報は ((hap1:1.5,hap3:1.5):1.5,(hap2:0.5,(hap0:2.33333333333333,hap4:0.666666666666667):1.5):0); のような書式に盛り込むことがある。これをNewick書式と言う。 この書式を読んで系統樹を描くアプリケーションはフリーのものもある…

多ローカス・多人種・多フェノタイプ・ハプロタイプデータ管理フォーム(案)

※一部文字化けしています データ管理1 アイテム (1)遺伝子 (2)ローカス (3)個人2 遺伝子 2-1 遺伝子の定義 DNAとして親から子へ伝達され、機能性分子(RNA、たんぱく質)の発現を通じて個体の生命現象に影響を与える因子。DNA塩基配列とその配列の由…

Coalescent発生待ち時間の算出理論

参考資料:19.6 Coalescent theory pp591 by C. Neuhauser in "Handbook of Statistical Genetics Second Edition" by D.J.Balding, M. Bishop and C. Cannings (2003) Wiley Wiley::Handbook of Statistical Genetics, Second Edition 仮定 ある世代時点Tに…

複数のローカスのジェノタイプデータの利用のために

前提 大規模なSNPジェノタイプデータの蓄積とそれを用いた推定ハプロタイプに基づく解析が行われている データ解析の方向性 一般論 物理的に遠隔の複数ローカスのジェノタイプデータを取り扱うことが必須である ローカスのジェノタイプデータはハプロタイプ…

ボーズ(一匹も釣れない)になる確率の指数関数exp(-x)表現

「(釣り人が)ボーズ」になる確率の説明404 Not Found 単位時間あたり、m匹の魚を釣り上げる釣り人が、t単位時間の間0匹しか釣果がない確率prob_Bを「ボーズ確率」と呼んでいる。ボーズとは、一匹も釣果がないこと(のようだ)。今、mが時間によらず一定だとす…

GBM(geometric Brownian model)※

Log-normal growthとも呼ばれる 特徴 Rateがランダムである ランダムではあるが、ランダム加減の程度は「現在のrate」に比例する Recombination rateのをある染色体の場所におけるrecombination rateとのlog ratio で表したとき、その2点間の物理距離と相関…

ケース・コントロール用ハプロタイプデータのシミュレーション生成に関して盛り込むパラメタ

参考文献no title Coalescent, recombination, diffusion, 変異のselection力, 人口増減, recombination rateのばらつきを盛り込んで、疾患責任変異とその周辺ハプロタイプをシミュレートし、そのハプロタイプに対して、phenocopy, 低penetranceを考慮して、…

全解析からの発想

全遺伝子を解析したのだったら、「必ず、TRUEが含まれるという観点でP値を評価できる」

複数のローカスのジェノタイプを組み合わせる

個々のローカス 個々のローカスの感受性寄与度は それ単独で観測することができる それ単独で機序を検討することができる 個々のローカスの感受性寄与度は 寄与するコンテクストを考慮して観測することができる 寄与するコンテクストを考慮して検討すること…

HAPMAPグループ(D. Coxら)によるScience論文で使われているtagSNP法の原法の解説

ペアワイズLDインデックスを用いた "Greedy" algorithmの特徴 LDインデックスとしてr^2を用いる Pairwise LDインデックスとしての"delta^2=<I>r^2</I>"を使用(※"^2"は自乗を表す) "D'"と"delta^2=<I>r^2</I>"の違い D'=0とは: