メモ
http://www.stat.uchicago.edu/~pmcc/pubs/clusters.pdf クラスタ数が不明なときに、観測データからクラスタ数をどう読み取るか Ewens's sampling formula(Wiki) 不定のクラスタをもつ集団からの有限サンプリングに関する集団遺伝学・生態学的な式 untbパッ…
Surrogate paradoxという話があるそうだ(こちら) 『不整脈がある。抗不整脈薬で治療をする。不整脈が抑えられる。ただし、ときとして、致死性不整脈が誘発されて、死亡率は上がる』というような文脈 抗不整脈薬Xが不整脈という中間形質Sを介して最終形質…
研究発表を拝聴しながら考えたこと 生存期間中央値(MST)のこと 生存期間中央値についてはこちら、とか 生存解析をしていて、介入の効果を1つのスカラー量で表すとき、生存時間の中央値を取り出して比較することはよくやられること 指数関数の尾が2つ並んで…
アレル共有距離(Allele sharing distance)というのがある。これは、すべてのハプロタイプの差異が変異によるとみなしたときに適当な距離の定義である。種間距離を測るときなどは、これが適当である。全座位が異なるハプロタイプ同士の距離が最大となる。 組…
生命体集団が、空間中の適否に左右されながら、経時的に存在するとき、その分布行動は、おそらく粘菌のそれに近いだろうと予想する。 粘菌のそれ、とは 空間は十二分に広く、覆いつくせない 生命体(または、その集団)は、どんなに繁殖しても、個体数は少ない…
生命体が生命体として存在しているとき、複数の(多数の、膨大な多数の)要素が作用しあっている。要素同士は、協調しながら、足を引っ張りながら、相互の作用が一定範囲にとどまることから、生命体の「特徴」である「形質」が観測可能になる。観測するのに適…
単純なところでは、統計量の分散インフレーションがあるときに、メタアナリシスを行うとして、その分散インフレーションの補正項がどういう挙動をするのか、ということ 大まかなくくり(遺伝子とか、機能パスウェイ単位とか)での比較をしたいけれども、その…
共分散は2項目間の関係、多項目間の関係を含めた、分散・共分散・多次元共分散テンソル? 2項目間の関係・ばらつきは、『面積』。多項目間は『多次元直方体』。モーメント。外積。
これの続き
ハプロタイプ配列の比較 2染色体の配列が得られたとする。 同一か異なるかを座位ごとに比べることができる 同一か異なるかがどのように連結しているかを場合わけすることができる その連結具合の場合わけがどのような分布をするかがゲノムワイドで特徴を持…
カタラン数の規則をそのまま使って、組み換えなしの配列変遷を抽象的に捉える カタラン数の規則を(たぶん)若干改変・拡張して、組み換えありの配列変遷を抽象的に捉える PDFリンク 日記内リンク
カテゴリ数nで次元数kの高次元立方体分割表にて、k次元別に観測がなされたとする。そのときの自由度は
一般化平均: 最小値: 調和平均: 幾何平均: 算術平均: 二乗平均: 最大値: さらに一般化して一般化f平均 ある事象が確率pでおきるとき、その事象が繰り返し起きる確率は。一般化平均のいくつかの排反事象があるときに同一事象が繰り返し起きるときの確率の部分…
ディプロタイプとして、同居したハプロタイプ2本のヘテロ座位の間に組み換えが発生しうる。 組み換えは、遺伝的距離(物理的距離と組み換え率)が定める。 ディプロタイプとして、異なるハプロタイプ2本が同居するかどうかをHWDが定める。
2008年にブログに書いたり書かなかったりした事柄で、年越しを前に、机の上にはそれに関して整理のつかない走り書きが乱雑に積まれている。毎年のこと。来年につながるにしろつなげるにしろ、そうならないにしろ、そうしないにしろ、項目をリストにすること…
nsample nmarker d d dsign(d) m ccov(t(m)) af
コンピュータによる数値計算における精度のこと。 浮動小数点のことなどあり、計算結果に誤差が出る話し。Mathematicaを用いて計算していたところ、任意精度という概念を採用していることはこちらに書いた。Mathematicaはを『1を3等分したもの』という形で…
このページは、脈絡のないメモ。とりあえず、いつものように、ウェブでサイトを集めてみる 基本的なソースとともに、教科書的な順行性記載のページ 分岐が深そうなサイト 日本語プログラム言語「ひまわり」を用いたシミュレータのダウンロードサイト 数式が…