2011-10-01から1ヶ月間の記事一覧

Isotonic regression, Pool-Adjacent-Violators Algorithm (PAVA)

こちらの記事でIsoGenenによる容量反応曲線解析について書いた このパッケージでの回帰はfortranのpavaを使っているという Rにはisotoneパッケージもある pava: pool-adjacent-violators algorithmはisotonic regressionの一つという それぞれの資料はこちら…

情報を利用する

こちらの続き こんな状況を考える 夕闇迫るある日、「泥棒!」という叫び声とともに走り去る後姿が そこは、ある小学校の前の道だった 小学校には下校しようとしていた複数の小学生がいた 目撃者情報を募ったところ 走り去ったのは男だった、という意見が6…

目撃情報

用量反応を大規模に

こちらの続き:用量反応を見るとする こちらにIsoGeneというRのパッケージの論文がある マイクロアレイのデータで、薬を振りかけて、用量依存に発現量が動くかどうかを大規模・マルチプルテスティングの枠組みで調べよう、いくつかの統計量があるから、ひと…

個体のフェノタイプと細胞生物学・分子遺伝学的フェノタイプ

個体レベルのフェノタイプ 化学毒物の用量反応曲線を考える 投与毒物量と個体レベルのフェノタイプ(発癌箇所数)に関する3つのモデルを考えよう(参考:こちら) 閾値モデル 閾値なしモデル ホルミシス効果モデル ここでのフェノタイプは、「分子レベル・細胞…

マクロなフェノタイプとミクロなフェノタイプ

ただの陽性・陰性にしたくない

この記事を、ROCの関連であると読めば、こちらの続き また、この記事を、大量のデータが臨床機関にストックしてあって、それを診断応用するという視点からは、こちらの続きでもある いずれにしろ、検査をして、診断に活かす話(こちら) 疾患陰性のときにある…

微妙な検査値と確実な検査値を分けて数値化したい

診断基準の項目数と必要項目数

こちらから 診断基準というものを使って、診断することがある もっとも単純には、N個の項目を立て、そのうちn項目が陽性ならば、その疾患であると診断しよう、というようなものである ここで、さらなる単純化をして、N項目について、「真に疾患であるときの…

診断基準と言う診断テスト

値を見て、2値判断をする

R ROC

検査値が連続的 それを見て、陽性・陰性に判定を分けたい 感度・特異度 PPV・NPV 陽性・陰性の2値に分けてしまうと、「どっちつかず」の部分の情報がもったいない 陽性確率p、陰性確率1-pのように出てくると、ある意味、便利 Rでは、ROCRパッケージなど(こ…

あいまいな領域

メソッドの標準化

実験技術の大規模化が進み、ハイスループットデータというものがそこらじゅうにある ハイスループットデータは、データ量が多いだけに、小さなバイアスが「確定的な結論」をミスリーディングする可能性が高い おのずと、データのクオリティコントロールが重…

幅のある事前確率・事後確率〜あいまいな「確率情報」を活用して判断するための準備5

この記事の構成 目次はこちら 幅のある事前確率・事後確率

ルールイン・ルールアウト〜あいまいな「確率情報」を活用して判断するための準備4

この記事の構成 目次はこちら ルールイン・ルールアウトとは何をしているのか ルールインとルールアウトは、それぞれ、「ある診断名に確定すること」、「ある診断名の可能性をゼロとみなすこと」である ルールアウトは、可能性のある診断名の数を減らす作業…

目次〜あいまいな「確率情報」を活用して判断するための準備0

この記事の構成 概論(何をしたいのか):こちらの記事 鑑別診断・診断過程:こちらの記事 検査の感度・特異度・PPV・NPV:こちらの記事 ルールイン・ルールアウトとは何をしているのか:こちらの記事 幅のある事前確率・事後確率:こちらの記事

検査の感度・特異度・PPV・NPV〜あいまいな「確率情報」を活用して判断するための準備3

この記事の構成 目次はこちら このような大規模集計を行っていると、検査の感度・特異度・PPV・NPVなどはリアルタイムで更新して利用することが可能となる 検査の感度・特異度は、ある検査の結果を集めて、それについて、診断名ごとに陽性・陰性の2x2表を…

鑑別診断・診断過程〜あいまいな「確率情報」を活用して判断するための準備2

この記事の構成 目次はこちら 鑑別診断・診断過程・診断支援システムの基礎的な動きについて考えてみる 非常に大きなデータソースがあって、「最終診断名」がある。その診断名に至るにあたって、ありとあらゆる情報取得(主訴、随伴症状、検査結果、他)がある…

概論〜あいまいな「確率情報」を活用して判断するための準備1

この記事の構成 目次はこちら 概論 こちらは鑑別診断の話題 それに関連してこうとかこうとか書いた これは、事前確率から情報を利用して事後確率を得るプロセスのこと こちらは、DNA多型マーカーを用いた個人識別の話 こちらでは行方不明者に関する情報を用…

情報を活用して判定することのもっとも単純な枠組み

ちょっといろいろ調べてみる

こちらの講義に出席してみる RのGenetics関係のパッケージのページ(こちら) RでHWE library(HardyWeinberg) x <- c(100, 50, 10) HW.test <- HWChisq(x, verbose = TRUE) HW.lrtest <- HWLratio(x, verbose = TRUE) HW.exacttest <- HWExact(x, verbose = TR…

SNPの解析の講義に出席する

ドースレスポンスカーブ

> opt.out $par [1] 5.271906 2.112786 5.655760 1.899040 $value [1] 0.1945089 $counts function gradient 205 NA $convergence [1] 0 $message NULL > opt.out2 $par [1] 13.855497 1.723488 19.658422 1.871615 $value [1] 0.1943919 $counts function g…

式の推定

作業をつなぐ〜微分・幾何・代数〜

記述統計で1因子について考える 複数因子について考えるときは因子の数の次元空間において、それより低い次元に納まっているのではないかと考える 次元を小さくしてそこに「何か」があると考えることは多様体学習(こちら)・多様体推定(こちら) 多様体に納ま…

サンプル数が多くなるときの漸近的収束

こちらで、二項分布での正確な信頼区間推定を行っている サンプル数の増大により、信頼区間幅がサンプル数の平方根に関して収束していくことを書いている p<- 0.8 trial<- 10*seq(from=1,to=100,by=1) apply(cbind(trial*p,trial*(1-p)),1,binom.test,0.5) a…

信頼区間が漸近的に収束する

成人ヒト細胞の分類 駆け足で読む『Quick Reference』of 『Human Molecular Gentics』

血液・免疫系(主要クラス数>30) Megakaryocyte(2種、megakaryocyte, 血小板) 赤血球(1種) 幹細胞(前駆細胞)(いろいろ,造血幹細胞) リンパ球(>10)(B,T,NK...) 単球・マクロファージ(>6) 樹状細胞(>4) (血中)顆粒球(3,好中球、好酸球、好塩基球) マスト細胞 線…

駆け足で読む『Quick Reference』of 『Human Molecular Gentics』

Human Molecular Genetics作者: Tom Strachan,Andrew Read出版社/メーカー: Garland Science発売日: 2010/04/22メディア: ペーパーバック クリック: 6回この商品を含むブログ (2件) を見る 見開きに"Quick Reference"がある それを「ざっと」読むと、「生物…

モデル動物データベース 駆け足で読む『Quick Reference』of 『Human Molecular Gentics』

Saccharomyces cerevisiae 線虫 ショウジョウバエ zebrafish マウス