2005-10-01から1ヶ月間の記事一覧

グラフの基本は木

ARG

木のハンドリングの基礎の基礎。情報圧縮処理で用いる文字コードの2分岐木(Huffman木)表記に関する説明と、その木情報の格納形式とハンドリングに関する記事はこちら。同記事、および、グラフの縦型探索・横型探索のアルゴリズムについての記事でも参照して…

Lorenz(ローレンツ)アトラクタ

※ !!!複雑系の諸用語につき、相当、あやふやなので、おおいに誤りを含む可能性がある記事。覚書として、記すが今後の修正、おおいにありえる。 気象学者 E.N.Lorenzは、気象現象を3要因と時間の4因子でモデル化した。モデルは3つの連立微分方程式から…

Wright-Fisherモデル

繁殖モデルの1つ 有限個体数集団 Diploid集団を扱う 世代のオーバーラップなし 集団個体数は一定(N) Random matingとHardy-Weinberg平衡 次世代diploid個体の作成 親世代染色体数 2N のプールから2染色体をランダムサンプリングして1個体としそれをN回繰…

ARGをシミュレーションで作成する

まずは、既存の設定をなぞる。ひとつは以前書いた、Yang et al. の設定が参考になる(こちら)。もうひとつはここ数日ARG関係で引いている論文の設定である。関連記事はこちら。本記事では、こちらのパラメタ設定を記す。論文中には明示していないが、ARG作成…

Rのプログラムを並列処理

こちらへ移動しました

MCMCによるDirichlet random generation再考

作業は統計環境『R』を用いるものとする。ガンマ分布や、Dirichlet分布からの乱数発生関数 rdirichlet (MCMCpack)を用いる(その使い方についてはこちら) サイコロ 今、サイコロの「できのよさ」を調べながら、そのサイコロで博打をうつことを想定する サイ…

Metropolis-Hastingsアルゴリズム

マルコフ連鎖を用いて、世代を順次進めていくときに、次世代のパラメタの値を得るためには、次世代のパラメタ値をある分布(関数)(サンプラと呼ぶ)から作り出し、その作られた値を次世代のパラメタの値として妥当かどうかを判断する、という手続きを踏むと未…

2分岐木ARGのMCMC構築

Zollner et al(2005)の例 推定過程は着目点をはさんで左右両側で行う 変数 Neutral coalecent and recombination モデルを規定する変数 組換え率 変異率 これら2つの率はARG構築過程で不明な変数である ある位置におけるARGは2分岐木である(親ハプロタイプ…

ARG上の責任ローカスの位置の事前確率・事後確率

Zollner et al(2005)の例 前提 ある領域に多型マーカーが存在し、あるフェノタイプの責任ローカスを特定しようとしている その多型マーカーの位置情報が得られている この領域のマッピングをするにあたって、個人がおり、そのフェノタイプ情報が得られている…

統計モデル

統計モデルとは 知りたい何か(それは性質であったり、数量であったりする)がある 知りたい何かの真実を知ることができない状況である(ほとんどすべての知りたいことは推測するしかないという意味では、すべての『知る』という作業にあてはまる) 例:あるもの…

隠れマルコフモデルについてのイントロダクション

このレビューは短く(2ページ)、述べるべきをほぼ尽くしている 隠れマルコフモデルとは 統計モデルのひとつ 統計モデルは簡単にいうと、知りえた情報をもとに、知りたい真実へとたどり着くための道筋のこと 統計モデルの若干長い説明はこちら 知りたい真実が…

経済関係のページ,MATLABとかベイズとか

Scilab URL

処理用パッケージやツール

グラフ理論系 GISシステム関係 ネットワーク・社会系 ベイズ Rのパッケージ deal

Ancestral Recombination Graph

ゲノムDNAは祖先から子孫へと伝えられる。伝えるときに、組換えという現象があり、あるゲノムDNAは2つの親ゲノムDNAのモザイクとなることがあり、このようなときに子ゲノムDNAを組換え体(recombinant)と呼ぶ。組換えの影響を受けない場合には、…

ポアソン過程・指数分布・ガンマ分布・ワイブル分布・ベータ分布

Coalescentを含めモデルを扱った論文を読んでいると、文中でさらっと、『「ガンマ分布」を用いて、次のようにモデル化する』というような表現が出てくる。引用文献がついている場合もあるが、基本的な分布などになると全く何も書かれていない(当然だが)。と…

グラフのeccentricity(離心性)と半径(radius)と直径(diameter)と中心(center)とその他

参考サイト 説明 Connected graphを考える Eccentricityは個々のノードに定義される あるノードについて、以外のすべてのノードについて、グラフ上の最短距離を求める(グラフ上の最短距離は、エッジに長さが与えられていなければ、エッジ数に同じ) 今、この…

Most recent common ancestor文献メモ

文献 この論文で用いられているグラフ理論の用語や指標はこちら 染色体のタイプ別 Maternal line: Mitochondrial DNA Paternal line: Y染色体(但し、psuedoautosomal region等を除く) その他(Autosomal chromosomes) Random mating モデルでの試算 染色体の…

Universal ancestor,Most recent common ancestorとidentical ancestors point

Most recent common ancestor 引用文献 詳細はこちら Universal ancestor 引用文献 ヒトの現時点の個体集合は、過去に存在した祖先の子孫である。祖先の数は、増えていく(父母より祖父母、祖父母より曽祖父母の数が多い)。逆に言うと、ある世代のある個体は…

Zollner S et al. (2004)の論文

論文はこちら ソフトウェアTreeLDのダウンロードはこちらから ベイズ ケース・コントロールを併せてARGを構成する Chromosomal sharing backwards in time ARGの複雑なグラフ構造の起源はrecombinationであり、recombinationの影響を受けていない限局…

Morris, A.P. et al.(2002)の論文

論文はこちら Rannalaと似ている部分は多い 差は Intra-Allelic Coalescent Model か Shattered Coalescent Modelか 後者では、変数を用いて、樹形図を複数の木に分離し(現実世界のハプロタイプの継承関係に近づけている(ことにしている)) 複数の責任変異を…

Liu, J.S. et al.(2001)の論文

論文はこちら ベイズを使った確率モデル 責任変異の位置とAncestral haplotypesを推定する 近接領域に複数の責任変異を推定する 物理距離と遺伝的距離には既知の換算式(Haldane's map function)を使用 組換えの発生はPoisson過程を使用 それぞれの責任変異の…

McPeek,M.S. et al.(1999)の論文

論文はこちら 領域にマーカーが分布している 領域には組換え率が変数として与えられる。この組換え率変数は推定の対象となる 世代を遡ったハプロタイプからある線分(マーカーによって区切られる)を継承しているということを次のように条件付ける 継承線分両…

Morris, A.P. et al.(2000)の論文

論文はこちら 隠れマルコフについてはMcPeekの論文の記載を参照 MCMCについての記載はLiuの論文の記載を参照 セクションを切って記載してあるのは マーカーに変異を許すこと Phenocopyを取り扱うこと 組換え率の分布を位置によって非均一にできること

Lam, J.D et al.(2000)の論文

論文はこちら 木の作成は単純。その木が正しいものとして、責任変異の位置を尤度を用いて推定する方法 領域にマーカーが分布している 隣同士のマーカーが作る線分(2マーカーによるハプロタイプ)を対象にする 疾患責任変異は、いずれかのマーカー間に存在する…

Fine-scale Mapping with Coalescent Model

Lam, J.D. et al.(2000) 論文はこちら 記事はこちら Parsimony と尤度 星型樹形図 Morris, A.P. et al.(2000) 論文はこちら 記事はこちら ベイズ 隠れマルコフ過程(簡易解説はこちら) MCMCによる事後確率推定 星型樹形図 McPeek,M.S. et al.(1999) 論文はこ…

Coalescentのイントロダクション

Coalescentとは 英単語としては「癒合した」とか「合体した」とかいう意味 あるDNA断片とあるDNA断片との関係がcoalescentというのは、2本のDNA断片を過去に遡ると、同一のDNAに癒合するという意味 あるDNA断片(染色体の一部)は、新規の変異…

Larribe et al. (2002)の論文

論文はこちら ベイズでARGを推定後、その樹に基づいて責任ローカスをシミュレーションベースで推定する

Fearnhead et al. (2001)の論文

論文はこちら ソフトウェアはこちら Full likelihoodでARGを推定後、その樹に基づいてMCMCでrecombination rateを推定する

Quasi-Score,Quasi-Likelihood

元記事はこちら Score(スコア)もLikelihood(尤度)もそれを使って、「最尤推定値」を求めるもの(こちらも参考)なわけだけれど、ScoreにしろLikelihoodにしろ、うまいこと直接算出できないときにQuasi-Score,Quasi-Likelihoodを算出してそれをScore,Likelihood…

Intra-Allelic Coalescent Model

参考文献はこちら ハプロタイプ系統樹において、あるアレルをもたらす変異に着目する。その変異を持つハプロタイプが作る木は、その変異を持たないハプロタイプが作る木と、その変異に相当するエッジのみにて連結であるような木を想定したCoalescent過程を I…