2012-11-01から1ヶ月間の記事一覧
n個の標本値があるとき、その標本分散はと表される これはでもあるというのはこちらのメモの通り この式は、すべての値ペアの距離の二乗の平均を2で割ったもの 無限個ある(かもしれない)母集団のすべての値ペアの距離の二乗の平均(それは母集団のすべての値…
選挙の頃 反映したい母集団の意見は複数の軸で定義されている 各軸を単純化して、賛成・反対とするだけで、軸数nに対して通りの意見がある 今、通りの意見パターンごとに1つの「意見代表団体」があれば、その団体の得票数に比例して全体の意見を反映させれ…
こちらで臨床検査の感度特異度の話、そのベイズ的使用のためにきおくするべきことの話が出ている 興味深い 現実医療現場では、「状況(事前確率の高低カテゴリ)」「使用検査」「判断したいこと=確定診断したい・ルールアウトしたい」の組み合わせに対して、…
こちらでZDD/BDDについて書いた その元ネタとしてこちらがある その中に頻出アイテム集合マイニングという話題がある スーパーで、スーパーの全商品リストを全体集合とし、顧客の1回毎の買い物リストを、部分集合としたときのデータハンドリングの話 まず、…
論文(Multilevel Linear Dimensionality Reduction using Hypergraphs for Data Analysis)
GSEA(こちら,ペイパー) GSEA_変法 MA plot(こちら)
こちらで分散・共分散と遺伝率が話題になった 共分散ってなに?と口語で説明したいときに: 「平均は計算したい」 「平均を計算したら、平均を中心としたばらつきは計算したい」→分散 変数が2つあるとき: それぞれの変数に平均は計算できる 2次元空間的な…
バイナリデータの決定木ダイアグラムにBDD/ZDD/seqDD/piDDがある(さんこうこちらやこちら) BDDは2値判断の塊 ZDDは組合せ集合向け seqDDは配列向け piDDは置換集合向け(piDDについて) 置換は異なる染色体上の遺伝子のシャッフリングに対応 組合せ集合はハプ…
バイナリデータの決定木ダイアグラムにBDD/ZDD/seqDD/piDDがある(さんこうこちらやこちら) BDDは2値判断の塊 ZDDは組合せ集合向け seqDDは配列向け piDDは置換集合向け(piDDについて) 置換は異なる染色体上の遺伝子のシャッフリングに対応 組合せ集合はハプ…
こちらでポアソン分布を気にしている その続き L回の観察機会のうち、 ([tex:k この事象をN回観察する機会があったら、何回起きると予想するのだろうか? L回の観察、k回の生起、から、ポアソン分布のパラメタの確率密度分布を、ガンマ分布として推定するこ…
こちらでgene go-expression network解析が紹介されていた(このスライドが一番わかりやすい) ネットワーク解析だ ノード間のエッジの重みにカットオフをかけて0,1にした上で、グラフのトポロジーを考えている 特徴的なグラフ、たとえば、複体グラフとかは…
ポアソン分布を気にしている(こちら) こちらでポアソン事象の観測データを積み重ねていき、そのポアソン分布のパラメタが収束していく様子をガンマ関数で視覚的に見せている RのRColorBrewerパッケージというのを用いて色を作っている library(RColorBrewer)…
Rの傾向性の検定関数prop.trend.test()を見てみよう 以下に示すように、xというベクトルとnというベクトルとscoreというカテゴリの「値ベクトル」が入力 いわゆる分割表的に言えば、x,n-xがケースとコントロールのベクトルで、nはケース・コントロールの和の…
昨日の記事はポアソン分布 今日は二項分布 こちらでは正規分布へのあてはめをしている 正規分布へのあてはめのときには、平均と分散との2パラメタを用いるので自由度の手加減のときに2を引く 二項分布のときは…1を引くようだ 期待値の小さいセルの合併は…
ポアソン分布らしい観測データがある ポアソン分布にフィットするかどうかは、こちらのような適合度検定でできる 期待値からポアソン分布のパラメタを求めて、そのパラメタ値の下での期待度数と観測度数のずれをカイ二乗統計量にして検定している 分布パラメ…