樹状分布

こちらで濃淡がいろいろな分布とその上のディリクレ分布のことをやっている こちらでフローサイトメータをやっている まずまずな樹状形の分布をランダム発生させてみる 適当に枝分かれルールを作り、枝の長さをつくり、それを順次「生やす」ことで木型を作る…

木の上の分布比較

ルートのある2分岐木状の分布があるとする。その分布は、ノード数がnで(エッジ数がn-1)。すべてのサンプルで木のトポロジーは同じとする 各ノードに確率があって、であるという また、各エッジには長さがあるという サンプルことにが異なるときに、これをど…

すべてのハプロタイプは世界に1本だけ配列のとき

SNPのハプロタイプは0,1 Nh<-10 # 染色体本数 Nm<-20 # SNP数 # 適当にハプロタイプを作る H<-matrix(sample(c(0,1),Nh*Nm,replace=TRUE),Nh,Nm) 染色体が2本合わさってディプロタイプを作る 染色体のプールからランダムにペアを作るとそれはHWE仮定 Shuffl…

クラスタリングの場合の数 その2

Rにphangornというパッケージ(CRAN記事はこちら)があって、その中のallTrees()という関数があって、それが数え上げてくれる。ただし、すべての木を作る関数なので、葉の数は10個まで。 library(phangorn) allTrees(5) 15 phylogenetic trees trees <- all…

クラスタリングの場合の数

今、N個のサンプルがあって、これを2分岐木のクラスタに纏め上げたいとする 何通りの木の形状(トポロジー)があるんだろう? 漸化式で考える がその数とする である のときを考える まではわかっているとして、Nの場合を知りたいものとする はに分けることが…

Smart Game Format

囲碁・オセロなどの対戦ゲームでは、交互に「イベント」があり、それによって、「状態」が変化する。この過程を履歴として残したものが、棋譜である。これをアプリケーションで用いるときのフォーマットのひとつがSGFである。 「木」構造をとっているという…