2012-01-01から1年間の記事一覧

piDD

バイナリデータの決定木ダイアグラムにBDD/ZDD/seqDD/piDDがある(さんこうこちらやこちら) BDDは2値判断の塊 ZDDは組合せ集合向け seqDDは配列向け piDDは置換集合向け(piDDについて) 置換は異なる染色体上の遺伝子のシャッフリングに対応 組合せ集合はハプ…

データを見て予測する

こちらでポアソン分布を気にしている その続き L回の観察機会のうち、 ([tex:k この事象をN回観察する機会があったら、何回起きると予想するのだろうか? L回の観察、k回の生起、から、ポアソン分布のパラメタの確率密度分布を、ガンマ分布として推定するこ…

ポアソン分布・ガンマ分布・ポアソン分布へ戻る

ネットワークのトポロジー解析

こちらでgene go-expression network解析が紹介されていた(このスライドが一番わかりやすい) ネットワーク解析だ ノード間のエッジの重みにカットオフをかけて0,1にした上で、グラフのトポロジーを考えている 特徴的なグラフ、たとえば、複体グラフとかは…

収束の様子をきれいに描く

ポアソン分布を気にしている(こちら) こちらでポアソン事象の観測データを積み重ねていき、そのポアソン分布のパラメタが収束していく様子をガンマ関数で視覚的に見せている RのRColorBrewerパッケージというのを用いて色を作っている library(RColorBrewer)…

ポアソン分布・ガンマ分布

傾向性の検定

Rの傾向性の検定関数prop.trend.test()を見てみよう 以下に示すように、xというベクトルとnというベクトルとscoreというカテゴリの「値ベクトル」が入力 いわゆる分割表的に言えば、x,n-xがケースとコントロールのベクトルで、nはケース・コントロールの和の…

二項布か

昨日の記事はポアソン分布 今日は二項分布 こちらでは正規分布へのあてはめをしている 正規分布へのあてはめのときには、平均と分散との2パラメタを用いるので自由度の手加減のときに2を引く 二項分布のときは…1を引くようだ 期待値の小さいセルの合併は…

二項分布の検定

ポアソン分布か、ポアソン分布としたら、どんなのか

ポアソン分布らしい観測データがある ポアソン分布にフィットするかどうかは、こちらのような適合度検定でできる 期待値からポアソン分布のパラメタを求めて、そのパラメタ値の下での期待度数と観測度数のずれをカイ二乗統計量にして検定している 分布パラメ…

ポアソン分布の検定

Gephi

Gephiというグラフ・ネットワーク用アプリを教えてもらった(こちら) Rのigraphパッケージからwrite.graph()関数を使ってgmlフォーマットで出力すれば乗せられる 5万ノード、50万エッジで描けるらしい 動的ネットワーク分析という用語もあるらしい グラフの…

分割したときの分布

日本人類遺伝学会での発表にこんなのもあった ゲノムワイドで何かしらの統計量が出せる ある基準でゲノム全体をいくつかに分割する(あまりはない、重複はない) 分割されてできる部分の大きさ(塩基数)は異なる 部分の大きさとその部分に計算される統計量との…

分けて計算する

日本人類遺伝学会

Weighted Gene Coexpression Network Analysisというのを使った発表があった サイトがこちら WCGNAパッケージ(R) Weighted newtork(Wiki記事)

振り返り

医学部教育の一環として、「医学教育を受けた、研究者」の養成支援というのがある(こちら) その合宿で、「自分が研究職に就くに至った経緯」を話すことになった(こちら) せっかくなので、記憶を辿って、「どうして、今、こんなことをやっているのか」の種が…

あれか、これか、と感度・特異度

あれか、これか、型の検査や情報というものを考える 「吐物の色が赤か茶色か」 「アレルがAかaか」 「光学異性体のD体かL体か」など その前に、検査学の復習をしておこう ある疾患の検査前事前確率がpであり、ある検査があって、その感度がu、特異度がv であ…

あれか、これか、と感度・特異度

機械に教える医学学習 補 点数をつける

こちらのシリーズの補助メモ ある関数があって、その関数はa個の引数をとり、b個のスカラー値からなる値の組を返すとする 線形的な量は、スカラー、ベクトル、行列、それらを一般化したテンソル(Rではアレイ)(こちら) 何かを量的に評価したいときには、b=1個…

機械に教える医学学習7 陽性所見と陰性所見

こちらの続き 「Aである」という情報は「A'ではない」という情報を含むことがある 「Xの色が赤である」という情報は「Xの色は青ではなかった」という情報を含んでいる 診察における、症状・兆候の取得と記載においては、「主訴」→「主訴についての臨床行為を…

機械に教える医学学習6 有用な情報

こちらの続き 今、あるpが与えられたときに、Qの要素q1,...,qnのそれぞれに対して、値が算出できるとする これまでの考え方から言えば、pはある症候であって、Qは診断名の集合、qiは個々の診断名であり、p、Qはグラフ状の知識体系として表現してあり、値はこ…

機械に教える医学学習5 画像で覚える知識

こちらの続き 言語情報ではない、画像で入力して、画像のまま記憶する知識もあるだろうという話になった たとえば解剖 Rではテキストマイニングのパッケージtmの中にある関数readPDF()を使うと、pdfファイルを読み込んでその文字情報とメタ情報を取り出すも…

メモ

こちらでポアッソン回帰の話を聞いた メモ 日本語PPT English pdf R package "mseq"

診断の一致の程度

今日の前の記事で紹介したSLE関係の話では、新規分類基準の性能を「ゴールドスタンダード診断」との正誤の程度として評価している Cohen's kappa(Wiki)を使っているらしい たまたま診断名が一致したのではなくて、「有意」に関連していますよ、という程度の…

CARTの説明に挑戦する

こちらでCARTを用いたSLEの分類基準について書いた SLEのこと、分類基準のこと、その意義・使い方については熟知しているが、統計や機械学習のことには拒絶感の強い人々を対象にCARTの説明をしてみることにする そのためのCART周辺の整理 機械学習(Wiki) 『…

Cohesive blocking of graph(2)

igraphパッケージのcohesive.blocks()関数のExamplesにあり、この論文の中でも扱われている例をとって、cohesive blocksの取り出し手順を確認してみよう k-component 連結な(サブ)グラフがあって、ノードを除去すると、(サブ)グラフが2つ以上に分けられると…

Cohesive blocking of graph(2)

Cohesive blocking of graph

Rのigraphパッケージにcohesive blockingというのをやってくれる関数 cohesive.blocks()というのがある Cohesive blockingのサイト Cohesiveとは粘着性のある、凝集性のある、という意味 論文は社会における人のネットワークについてのもの グラフの中のまと…

Cohesive blocking of graph

多次元化ROCカーブ

こちらでROCカーブとsurvival ROCカーブなるものを勉強した ROCカーブってなんだっけ? 2つの群があって、それぞれのサンプルがスカラー量を持っているときに、閾値を動かしてやって、その閾値の大小の割合を2つのそれぞれの群について算出する。閾値に対…