2012-03-01から1ヶ月間の記事一覧

打ち切りのこと

生存解析の特徴と言えば、「打ち切りサンプル」があること また、イベントが発生するごとに、その後のイベントの生起を考えるための全体集団が小さくなっていくこと 生存曲線を描いて、曲線間に違いがあるかどうかを検定する方法としてログランクテスト・一…

二値・非可逆フェノタイプで

昨日の記事で時間に関して離散的な観測データについて、そのまま・差分・累積をとり、それについて、統計量を作ってみることを書いた 今日の記事では、それを、良く知られた解析法が適用可能なデータ例に当てはめてみる 生存解析(「生死」を経時的に追跡する…

時系列データの関連を見る

こちらで疾患の時系列変化を作ってみた 疾患の経時的記録(カルテ)は、この指標を測定したり、あの指標を測定したり、と、測定時点がてんでんばらばら。それなのに、何かしらの判断が働いて、行動が起こされる その判断を決めているものは何なのか、その判断…

微分・積分して関係を見る

複数観測点のデータを使う

線形混合効果モデル(こちら) パッケージの説明PDF メタアナリシスのときに、複数のスタディに等しいリスクを想定するのがFixed effectモデルで、異なるリスクを想定するのがrandom effectモデルですが、線形回帰のときに、ベースラインや、回帰直線の傾きに…

Linear mixed model (lme4パッケージ)

iPOP特徴量抽出・相関検出

こちらの論文(Personal Omics Profiling Reveals Dynamic Molecular and Medical Phenotypes ) データ解析に関しては、Experimental ProceduresのExtended タブ(こちら) 以下、その手順 データを収集 時系列で データのタイプ Whole Genome Seq. Whole Exom …

周期的発現の検出

PLoS ONE論文 複数の方法の比較

疾病を次のようにモデルにする 病気の活動が潜んでいる その活動性を測定することができる 活動性の測定値によって、治療を一定期間投入する 完全寛解にはいたらず、治療をやめると、再燃する 疾患活動性がある程度高いと、不可逆変化も残る こんな場合に経…

時系列データを作ってみる

疾患が一様でないとき

関節リウマチを例に取ろう 以下の議論は「RF(+)リウマチとRF(-)リウマチ」という2種類のリウマチがあるので、厳密には、「診断確定のための検査」とは議論が異なるのだが、そのことはまた別の機会に書くとして。(気になる場合には、何かほかの検査なり情報…

疾患が一様でないときの感度特異度PPVNPV

Association rule learningの発展

0,1ではなく量的なデータを使う 順序ありカテゴリにする、Discretization(離散化)する Fuzzy setを使う Genetic algorithm(Evolutionary algorithm)を使う アイテムに階層構造を持ち込む 発見されるルールの最適化

arulesパッケージ

2値の疎なデータにあって、項目間の包含関係を単純な比として数値化する手法 大規模なデータであるから、演算自体を非常に単純化してある 大規模なデータであるから、項目の組み合わせを限定する基準が必要 arulesパッケージを使ってみる arulesパッケージ …

[[Association rule learning][Market Basket Analysis]消費者の行動データマイニング

Market Basket Analysis Association rule learning arulesパッケージ Introduction ElemStatLearnパッケージ

Association rule learningのアルゴリズム

Association rule learning(Wiki) Apriori algorithm Eclat algorithm FP-growth algorithm GUHA procedure algorithm OPUS search algorithm

Epiパッケージ

こちら

Cojoint analysisの情報ソース

市場のCojoint analysis(Wiki) The Concept of Conjoint Analysis 消費者心理のコンジョイント解析 Rのパッケージ prefmod conjoint Rでpsychology

駆け足で読む『リスク・リテラシーが身につく統計的思考法 初歩からベイズ推定まで』

リスク・リテラシーが身につく統計的思考法―初歩からベイズ推定まで (ハヤカワ文庫 NF 363 〈数理を愉しむ〉シリーズ) (ハヤカワ文庫NF―数理を愉しむシリーズ)作者: ゲルト・ギーゲレンツァー,吉田利子出版社/メーカー: 早川書房発売日: 2010/02/10メディア:…

駆け足で読む『運は数学にまかせなさい』

運は数学にまかせなさい――確率・統計に学ぶ処世術 ((ハヤカワ文庫NF―数理を愉しむシリーズ))作者: ジェフリー S.ローゼンタール,中村義作,柴田裕之出版社/メーカー: 早川書房発売日: 2010/07/10メディア: 文庫購入: 16人 クリック: 59回この商品を含むブログ…

関係づける〜Precision Medicineと微分・積分、状態・集合知・生物/環境相互作用〜

こちらでPrecision Medicineについて書いた こちらやこちらで生命現象の微分方程式的側面からの特徴をつれづれと書いた この二つをつないでみる Swarmでの1匹1匹の虫は「細胞」や、生命現象の「単位」 Swarmの行動を決めるのはDNAにコーディングされた、「…

Precision Medicineと微分・積分、状態・集合知・生物/環境相互作用

HGM2012@シドニー

HGM2012 癌ゲノムのメガ・スタディ 癌由来細胞と非由来細胞の選り分けのこと 「癌」を構成するための変異のセット(変異カクテル) 増殖性な性質と「悪性増殖」な性質? Molecular subclassesと治療選択、臓器別・組織別ではなく メチローム 化学修飾を介して…

時間軸上の多次元vs.多次元データ

昨日の記事では時間軸上に2つの量的尺度があるときに、その関連をスカラー量にする話だった この尺度は、各々、1次元だった また、微分・積分について考慮した 時間軸上にある、複数尺度の組み合わせ vs. 複数尺度の組み合わせの間に関連があるかどうかは…

差分を取る

昨日の記事(こちら)で、介入には期間があることがあることを書き、観察は時点であることを書いた 期間を持つ介入は連続する期間について、それぞれの値の介入を行うものとする 他方、観察はのように、個の時点で観察値があるとする 介入と観察は、同じ時空間…

期間介入と点観察シリーズ

素のデータで解析する

Electrical Health Record(EHR)を使ってゲノム疫学(EDGR(EHR-driven Genomic Research))をすることと、Electrical Health Recordにゲノム情報を持ち込んで医療をする/その医療の追跡をすること(EDGM:EHR-driven Genome Medicine)との異同を考える データのあ…

近縁関係

Plinkで近縁関係(参考記事:こちら)

電子カルテの活用、ゲノム疫学

電子化された臨床情報(Electrical Health Record)を用いた研究(EHR-driven genomic research)についてはこちらを eMERGE グループ(米国 Venderbilt、BROADその他)のページはこちら マルチ施設のphenotype集約・登録用のウェブインターフェースについてはこ…